|
Post by account_disabled on Feb 1, 2024 1:53:10 GMT -5
一直都是。我们大多数人都知道这一点。但由于资源有限,我们无法真正很好地比较链接索引的质量、大小和速度。坦率地说,大多数反向链接索引比较都很难通过高中科学博览会项目,更不用说严格的同行评审了。 我最认真地尝试确定链接索引的质量是在 2015 年,当时我加入 Moz 担任首席搜索科学家。但当时我知道,对于任何希望称自己为科学的、权威的,或者坦率地说,真实的此类研究来说,我错过了一个重要的关键:随机的、统一的网络样本。 但让我先提出一个简短的请求。请花点时间阅读本文。如果今天不能,请稍后安排时间。您的业务依赖于您引入的数据,本文将使您不再仅仅相信数据质量。如果您对某些技术方面有疑问,我会在评论中回复,或者您可以通过 我联系。我迫切希望我们的行业最终能做到这一点,并让我们自己作为数据提供者遵守严格的质量标准。 快速链接: 家 正确处理 随机有什么大不了的? 为什么不采用普通爬行? 如何获 目标电话号码或电话营销数据 得随机数 起点:获取种子 URL 根据域大小进行选择 选择伪随机起点 爬行,爬行,爬行 怎么办?定义指标 尺寸指标 速度指标 质量指标 现实与理论 注态 域名索引状态 链接指数奥运 下一步是什么? 关于 PA 和 DA 快速要点 正确处理 Moz 提供的最伟大的东西之一就是一个领导团队,它让我可以自由地做一切“把事情做好”。我第一次遇到这种情况是 Moz 同意在点击流数据上花费大量资金,以便我们可以提高我们的高级关键字工具 搜索量(这是一个巨大的、多年的财务风险,希望改善我们行业中的一个指标)。此后不久,Ahrefs 采用了该流程,两年后,SEMRush 现在也使用相同的方法,因为这是正确的方法。 在这个用巨大的 Link Explorer取代我们的链接索引的多年项目进行了大约 6 个月后 ,我的任务是解决“我们如何知道我们的链接索引是否良好? ”这个开放式问题,我一直在思考这个问题自从 2015 年发表那篇文章以来,我就知道除了从真正的“网络随机样本”开始的系统之外,我不会继续使用任何其他东西。 莫兹再一次要求我尽一切努力“把这件事做好”,他们让我继续做下去。 随机有什么大不了的? 好的随机样本的重要性怎么强调都不为过。让我先岔开一下。假设您看到一项调查,显示 90% 的美国人相信地球是平的。这将是一个可怕的统计数据。但后来你发现这项调查是在地球平论会议上进行的,而 10% 不同意的人是会议中心的员工。这完全有道理。问题是,接受调查的人样本并不是随机抽取的美国人——相反,它是有偏见的,因为它是在地平论大会上采集的。 现在,想象一下网络上同样的情况。假设一家机构想要进行测试以确定哪个链接索引更好,因此他们会查看数百个网站进行比较。他们从哪里获得这些网站?过去的客户?那么他们可能偏向于搜索引擎优化友好的网站,而不是反映整个网络。点击流数据?那么他们就会偏向于流行的网站和页面——这又不能反映整个网络! 从不好的样本开始肯定会得到不好的结果。 但情况变得更糟。像 Moz 这样的索引报告我们的总统计数据(索引中的链接数量或域数量)。然而,这可能会产生极大的误导。想象一下,一家餐厅声称拥有世界上最多的葡萄酒选择,拥有超过 1,000,000 瓶葡萄酒。
|
|