搜索播客:Gerry White 讲解使用日志文件进行 SEO 的 5 种方法
您如何利用日志文件来改善您的 SEO?
这就是我们今天要与一位在 SEO 行业拥有 20 多年经验的人讨论的内容,他曾在 BBC、Just Eat 和 Rise at Seven 等品牌和机构工作。热烈欢迎 Gerry White 收听 In Search SEO 播客。
在本集中,Gerry 分享了五种使用日志文件进行 SEO 的方法,包括:
查看 Google 如何查看您的网站
参数
是否有子域消耗您的抓取预算
JavaScript 和 CSS 文件
响应代码
如何使用日志文件进行 SEO
Gerry:嗨,很高兴来到这里。
D:很高兴您能来。您可以通过在 LinkedIn 上搜
索 Gerry White 来找到 Gerry。那么 Gerry,每个 SEO 都应该使用日志文件吗?
G:不,我知道当我说日志文件中有大量信息时,这听起来很有争议。但老实说,很多时候它的收益递减。通常,在查看日志文件之前,您通常可以找到大量信息。我的意思是,如果您查看 Google Search Console 信息,那里有大量信息。当我查看日志文件时,我首先会用尽很多其他地方。我总是建议使用 Screaming Frog 或任何桌面爬虫来爬取网站,然后在开始查看日志文件之前查看 Google Search Console。
我之所以这么说,以及当我要谈论日志文件有多有用时,我听起来几乎反对日志文件的原因,是它们实际上最初很难使用。而且确实需要一点技巧、知识和经验才能真正掌握它们,甚至访问它们。但今天的一件好事是,现在我们实际上比以往任何时候都更容易访问日志文件。最初,当我刚开始工作时,我们还没有 Google Analytics 或任何像今天这样的分析软件。日志文件分析是我们查看人们如何访问网站的方式。现在,我们很少查看日志文件来了解人们如何浏览网站,除非我们用信息安全做某事。或者我们做一些事情来诊断一些非常奇怪和奇妙的事情。
WhatsApp 更新为用户提供 保加利亚 WhatsApp 号码 了新的功能和改进提升了沟通体验这些更新包括更强的隐私设置用户界面的优化和新工具帮助用户更高效地交流了解最新的 WhatsApp 更新确保你能充分利用这款流行应用的所有功能网站名称是 (chetdata)。
但实际上,很多时候,我们 如何成为 Google 的第一名(并设法留在那里):以下是最有效的技巧 有更好的分析软件。这种情况可能会改变,因为实际上,一个奇怪的事实是,很多网站无法跟踪有多少人访问了 404 页面,因为很多时候,你永远不会点击接受 404 页面上的 cookie。突然间,日志文件又回来回答一些非常奇怪的问题。
但我今天谈论日志文件 DX 线索 的主要原因是出于 SEO 目的。所以是的,如果你在大型网站上遇到问题,如果你有一个大型电子商务网站,如果你有一个国际化、多语言、具有多面导航的大型网站,那么日志文件绝对应该被考虑,并且绝对应该尽快查看。
D:所以今天,你分享了 SEO 应该使用日志
文件的五种方式。从第一点开始,看看谷歌如何看待你的网站。
1. 看看谷歌如何看待你的网站
G:是的,谷歌相当难以预测,几乎就像一个不守规矩的孩子。这很奇怪,因为虽然我说我们可以查看网站,我们可以使用抓取工具来查看谷歌应该如何查看网站,但我们经常惊讶地发现谷歌对一组页面着迷或在某个地方走上了一些奇怪的路线。或者最近,我去年一直在为一家名为 Odor 的超市工作,我们发现的一个问题是,Google 机器人一直在密切关注分析配置,并从中创建虚假链接。Google 正在寻找断开的链接。很长一段时间以来,我都在试图弄清楚为什么它会找到根本不在页面上的数万个 404 错误。但事实证明,它一直在查看分析配置并从中创建链接。所以我们在看这有多大的影响。如果我们看到 Google 找到了所有这些 404 错误,这可能不是一个大问题。但现在我们想知道它花了多少时间处理这些 404 错误,如果我们修复这个小问题,是否意味着网站其余部分的抓取量将增加 20-30%?如果我们修复了这个问题,机会是什么?关键在于了解 Google 为何以那种方式查看该网站,以及它发现了什么实际上不应该发现的内容。
2. 参数
我们经常关注的另一件事是参数。我不知道您
是否知道,但 SEO 人员总是链接到页面的规范版本。我的意思是,一个页面通常有多个版本,有时会有某种内部跟踪或外部跟踪。我们可以通过多种方式链接到一个页面,例如,一个产品通常可以位于网站的多个位置。一个很好的例子是我在一个 Magento 网站上工作。每个产品似乎都位于每个类别下,所以当我们发现每个产品都有大约 20 个版本,并且每个产品都可以抓取时,我们感到很惊讶。因此,从那里我们知道 Google 也花费了大量时间来抓取该网站。有趣的是,如果你删除了某个产品,Google 会说“哦,但我还有 19 个其他版本的该产品”,所以如果你使用了 404 或类似的错误,由于 Google 的工作方式,实际页面几乎要消失一段时间才会消失。Google 会认为这是该页面的规范版本。但是,如果你删除规范版本,它就会开始使用不同的版本。这就是日志文件提供给我们的信息。让我们能够像 Google 一样查看网站。
它还允许我们查看状态代码之类的
内容。一个很好的例子是,有一个状态代码表示“我尚未被修改”。就我现在的生活而言,我想不出它是什么,我应该在播客之前把它写下来。但基本上,“我尚未被修改”极大地提高了网站的抓取率。当我发现这是 Google 尊重的事情时,我可以对所有图片、所有产品以及所有这些不经常修改的零碎信息进行处理,如果我们可以使用未修改的内容,我们可以提高 Google 的抓取速度,提高效率,减少服务器负载,那么我们就可以显著改善 Google 查找所有不同产品的方式。
我们希望、服务器管理员希望和每个人都希望 Google 看待事物的方式是服务器尽可能快速和高效。再次回到日志文件方面,如今,我们多年来根本无法有效地使用日志文件。因为使用 CDN,您经常会发现页面会在多个位置被访问。而 CDN 通常没有日志文件本身。因此,我们将查看所有这些不同的地方,看看这台服务器上有多少负载,那台服务器上有多少负载。我们尝试将所有内容拼凑在一起,日志文件的格式会有所不同。现在有了 CDN,我们实际上可以开始了解 CDN 的有效性。突然之间,PageSpeed 之类的东西受到了巨大的影响和改进,因为如果我们使用日志文件,我们就可以开始了解图像的事实,例如,通过图像的规范化,因此如果一个图像在多个页面上使用,只要 URL 一致,CDN 就可以正常工作,Google 就可以更好地抓取它。是的,日志文件有很多不同的方法可以帮助提高 PageSpeed、缓存以及更有效地为用户和搜索引擎提供服务。
D:我正在回顾您要分享的五点
。其中有一些您已经分享过的不同元素。你让我想起了一个人,我只需问一个问题,他们就会给我一个 15 分钟的播客节目,而不会再问任何问题。所以有一个人可能比你更能做到这一点。这个人可能是 Duane Forrester。 Duane 和我开玩笑说他这样做,我只问了他一个问题,然后我就走开了,让他分享本集剩余的内容。但你谈到了一点参数。我不知道你是否提到了第三点,即发现是否有子域名正在消耗抓取预算,因为不应该有。
3. 是否有子域名消耗了你的抓取预算?
G:这实际上可以追溯到 Just Eat。有一次,我们发现该网站在多个不同的子域名上被复制,并且所有这些都是可抓取的。现在,有趣的是,根据 Citrix 等工具,这些子域名没有可见性。而它们不可见的原因是它们都被规范化了。因此,当我们发现尽管这些重复项存在,但 Google 抓取这些子域名的预算却不到 60% 到 70%。而且由于 CDN 和其他技术,这些子域名没有以相同的方式缓存,这实际上造成了大量的服务器负载。所以这对我们来说是一件非常有趣的事情,因为我们只是忽略了这个问题,认为它需要在未来的某个时候才能解决。因为我们知道这个问题。我们知道存在这样的问题。