搜索播客:Lazarina Stoy 讲解 SEO 中的机器学习入门
您的 SEO 有多少是自动化的?您是否知道,将您当前正在做的事情自动化可以帮助您更快、更准确地完成工作?
今天,我们将与一位专攻技术和数据领域的 SEO 经理讨论在 SEO 中使用机器学习的六个步骤。她还是一名内容创建者,分享 Data Studio 仪表板、脚本和其他有用的工具,帮助和激励其他 SEO 更高效地完成任务。欢迎 Intrepid Digital 的 SEO 和数据科学经理 Lazarina Stoy。
步骤如下:
了解你的限制性信念并克服它们
了解机器学习中常见的任务规范、解决方案规范和数据规范
每天练习并开始做动作
评估新任务、其解决方案和数据特征,以了解何时需要机器学习
了解机器学习的局限性并仔细检查其输出
协同工作并设定合理期望
SEO机器学习
拉扎里娜:你好。很高兴来到这里。你好。
D:很高兴您能来这里。您可以在lazarinastoy.com找到 Lazarina 。那么 Lazarina,机器接管 SEO 还要多久?
L:我希望是很久以后。我们需要接管机器,这样我们才能更有效率。我希望他们不会接管我们。
D:也许与大脑的神经连接会有帮助。
L:是的,我们会比他们强很多。我们只需要正确地使用他们。把他们引导到我们需要的地方。
D:这对你来说有些积极意义。所以今
天我们来讨论一下在 SEO 中使用机器学习的六个步骤。从第一步开始,了解你的限制性信念并克服它们。
利基联系人列表 WhatsApp 号码 伊朗 WhatsApp 号码为您的业务提供精准营销的绝佳机会通过 chetdata您可以获取特定行业或兴趣的目标客户号码增强沟通效果立即访问发现如何利用这些专业的 WhatsApp 号码拓展市场提高销售转化率。
1.了解你的限制性信念并克服它们
L:这一小步实际上 如何通过本地搜索引擎优化为律师寻找客户 是在思考是什么阻碍了你进一步追求机器学习。是什么阻止了你开始使用 SEO 自动化 ,以及使用新奇的脚本和工具之类的东西。因为我经常听到很多人真的受到新技术的启发,他们想尝试。但他们有这些限制性信念阻止他们这样做。这不是 SEO 行业独有或特定的事情。实际上,这也是机器学习社区广泛认可的事情,因为这是很多开发人员实际上都存在的问题,因为他们自 RU 號碼列表 己并没有从机器学习开始。
实际上,机器学习社区中非常著名
的数据科学家 Jason Brownlee 已经列出了一些限制性信念,或者说一些你不愿开始的理由。如果我必须把它们写成陈述,那通常是我们对自己说的话,比如你必须是 Python 专家才能开始,或者必须是一个编码专家才能开始,或者你必须从头到尾了解机器学习领域。或者每个算法的作用是什么才能开始。或者你可能必须有很多空闲时间才能开始,或者你必须在日程安排中留出一些时间,或者有一台完美的电脑,或者其他你可能告诉自己的。最难克服的是你认为开始非常困难或具有挑战性。虽然大多数机器学习专家实际上会告诉你,执行机器学习模型实际上只需要三行代码。关键在于理解你的数据,知道在何时何地应用它。这是最困难的部分。
因此,克服这些限制性信念是第一步,因为实际上,开始并不难。你可以直接在 Google 上搜索机器学习和 10 分钟教程,从小事做起,每天养成习惯。这样,如果你只是在等待开始,并且在还没有开始时感到精神上的一些限制,你就会发现这是你需要做的一小步。你只需要从你的日程安排中预留 10 分钟并开始。一旦你执行了你的第一个脚本或安装、库和所有内容,你就会发现它实际上并没有那么具有挑战性。然后游戏发生了一些变化,然后你只需要看看你可以在哪里将这些模型应用于 SEO 的日常生活中。老实说,这才是有趣的部分。
D:明白。本质上,你说的意思是不要让技术阻碍你做事。你不必在真正开始之前了解技术的所有方面。
L:这很像 SEO 领域,你不需要了解所有
事情就可以进入这个行业。你只需要有热情和渴望去做这件事。
D:我认为挑战在于,许多 SEO 人员都有这样的心态,他们希望在做某事之前了解一切。我认为他们有这样的大脑,他们需要在做某事之前了解为什么。
第二是了解机器学习中常见的任务规范、解决方案规范和数据规范。
2.了解机器学习中常见的任务规范、解决方案规范和数据规范
L:是的,我先从数据开始。你需要知道当你在搜索一个特定的……假设你已经通过了第一步,你有一些日常练习,也许是 10 分钟的教程,你觉得这非常酷和花哨,你已经做了一段时间了。现在你在日常生活中遇到了一项任务。你想看看机器学习是否是帮助你克服所面临的一些挑战的正确解决方案。你需要考虑的三件事是你拥有的数据特征。即你要应用机器学习的数据集。它可以是文本、数字数据,也可以是基于图像的数据。但我们在这里谈论的是初学者的情况,当然,你还有其他东西,比如多模态机器学习,你可以应用视频或音频文件,并将机器学习应用于它们。但我们在这里只谈论初学者的情况。大多数情况下,作为 SEO,我们给模型的任务都是基于文本的,例如页面上的内容,或者是数字。例如,如果您试图预测自然流量,或者您试图预测您将获得的点击次数,等等。
说到任务特征,我们知道机器学习
有两个主要领域:监督式和无监督式。我们需要知道在最常见的情况下,可用于这些特定类型任务的主要模型。因此,对我们来说,监督式学习意味着您有标记数据来验证模型的输出。而无监督式则相反,您没有办法验证结果。在监督式学习中,有回归之类的东西,即进行预测,或分类,即根据现有类别分成组。
举个例子,我们已经讨论过的预测,比如预测自然流量之类的,就是一个很好的例子,尤其是在处理大数据或分类分组时。例如,如果你的博客中有一部分已经按特定类别分类,而你又有新内容想要归入这些特定组之一,那么你就可以使用分类来帮助你。在监督学习中,你可以使用聚类降维,它更高级一些,你可能会用到它,比如当你有非常大的数据集,或者当你遇到一个你没有办法验证的问题时。很多时候,你也可以结合这两种方法。
说到解决方案的特征,最重要的是要知
道何时何地应用机器学习。在我的网站和博客《机器学习初学者指南》中,我实际上列出了几个流程图,可以帮助您了解应用机器学习的过程以及这是否是它的正确用例。例如,如果您不处理大数据,那么它就不是机器学习,它实际上可以在电子表格或 Google 表格中使用几个统计公式来完成。因为本质上,大多数机器学习模型的核心就是统计数据。是的,如果它是任务关键型的,就像您正在执行的任务一样,您根本不应该依赖机器学习。如果您需要与利益相关者建立联系,了解结果实现的方式,或者尝试解释或复制该模型的输出,那么您应该避免某些模型,例如监督机器学习或深度学习,因为它们中的大多数都像黑匣子一样工作。这是非常困难的,特别是在大数据的情况下,要复制模型所做的事情以达到输出结果。
这里有很多值得思考的地方。但我只
想说,如果你理解这三件事,并且能够针对你的具体问题说,“好吧,我的数据是文本。我需要的模型是基于回归的,或者可能是基于分类的,或者其他什么,所以你需要确定你的数据是什么,你的任务是什么。你需要了解你要寻找什么类型的解决方案。如果你能做到这一点,那么找到合适的资源来帮助你实现目标就会容易得多。
D:第三点是进行日常练习,并开始完成练习。
3. 每天练习,开始按部就班
L:我想我在上一步中提到过这一点,但日常练习至关重要。对我个人而言,这意味着我想做一些与 Python 相关的事情,因为这是我的首选语言。但它可能是 JavaScript,也可能是你感兴趣的任何其他语言,你可以找到足够的机器学习资源,并尝试每天做一些与机器学习相关的事情。现在,这可能不是每天都进行全面的项目,因为这可能需要花费大量时间,特别是如果你正在从事一个大项目。但它可能是理解函数的工作原理,可能是根据你拥有的历史数据运行模型,或者将机器学习纳入你的审计,找到测试机器学习的新方法。所以日常练习至关重要。它让你保持警惕,特别是因为它可以帮助你了解机器学习本质上可以做什么。如果你知道它能做什么,那么当你开始你的日常工作时,你会更容易找到将机器学习嵌入到流程中的机会。我想在这里强调的是,这并不意味着你应该拥有只需单击按钮即可完成的完全自动化解决方案,你就可以完全自动化你的工作。这意味着,如果你可以将你正在处理的特定项目分成 10 个不同的部分,如果你可以帮助自己自动化或嵌入机器学习,也许其中两个,那么你就可以有更多的时间专注于其余 10 个部分的输出。或者你也可以将这段时间用于职业发展项目,例如培养你的领导能力、沟通能力等。本质上,这是关于何时何地使用机器学习。做到这一点的最佳方法是熟悉它。因此,日常练习是关键。
D:这就引出了第四点,当遇到新任务时,评估任务解决方案和数据特征,以了解是否真的需要机器学习。
在每个营销渠道中超越您的竞争对手
数据驱动的营销规划和竞争对手分析的一体化解决方案
4.评估新任务、其解决方案和数据特征,以了解何时需要机器学习
L:是的,我之前也提到过。有很多不同的方法可以评估是否需要机器学习。我已经提到过那几张流程图。但本质上,你遇到的每一项任务,比如编写元描述,因为这是我们经常做的事情。好吧,我们不应该花太多时间在这上面。我们知道它们对 SEO 来说不是很重要,但作为页面优化项目的一部分,这是你应该做的事情,你应该优化它们。
让我们在这里解构一个任务。如果你说你的输入数据是文本,那就意味着页面内容是文本。那么在这种情况下,任务是什么?是监督的还是无监督的?我们知道它是无监督的。因为我们没有办法验证输出的结果,所以我们必须自己做,我们没有自动化的方法来做。在这种情况下,我们将寻找一个转换模型,例如,获取页面的文本,并将其转换为少于 160 个字符的输出。因此,从文本中获取句子意味着提取,也可以是摘要。但另一种方法是使用像 GPT-3 这样的生成模型。我们给它输入,即页面上的文本,它会生成元描述并从头开始编写它们。
回到它是否是任务关键的问题,我们
知道它不是。所以机器学习很适合这种类型的练习。有时,当您为同一类型的页面运行此模型时,您可能会得到不同的输出,这可以吗?例如,如果您运行模型两次,您可能会为同一页面获得两个不同的元描述。这完全没问题。我们可以从两者中选择。这根本不是问题。我们需要解释我们是如何编写这些元描述的吗?不,完全不需要。我们不需要向利益相关者解释我们是如何做到这一点的。它的表现是否优于平均方法?当您想要评估是否要使用机器学习时,这是一个非常重要的问题,我们可以说是的,绝对的,因为如果您采用这个框架并将其应用于您想知道是否应该使用机器学习的任务,那么速度会快得多,然后您可能会很快发现哪些任务适合机器学习,哪些任务不适合。举个例子,这也可能取决于细分市场,因为如果我们以完全相同的例子来说明,对于标题和 H1,我们可能会说,对于一个竞争非常不激烈的细分市场,它并不重要,因为它不是你的钱或你的生活之类的东西,那么我们可能会说,绝对相同的立场,它不是任务关键型的。这些任务可以自动化,我们可以实施机器学习,我们不需要解释我们如何编写标题和 H1。但如果我们说,例如,我们的客户是 HMRC,我们知道这一点非常重要。我们不想建议一些不完全正确的标题、H1 或元描述。所以你有时也可能会觉得,你的客户或你所在的行业,或者你正在工作的特定网站,可能是你无法实施其中一些工具的原因。
D:我认为这很好地引出了第五点,即在使用机器学习时,了解其局限性,并仔细审查输出。
5.了解机器学习的局限性并仔细检查其输出
L:当然,这一点非常重要,因为我曾多次认为机器学习可以做某事,并且我已经实现了一个模型或测试了一个脚本或类似的东西,因为那里有太多的脚本。老实说,如果你知道如何搜索它们,几乎任何你能想到的任务都有一个脚本,你只需要知道如何将它应用于 SEO 中的特定问题。我测试过一些脚本,但最终没有使用输出的次数很多。所以你需要知道机器学习能做什么。目前,机器学习正处于一个非常擅长于狭义任务的阶段,但大多数模型,它们的训练方式,以及作为初学者,你将大部分时间使用预先训练的模型,你不会自己训练它们。这本身就是另一个话题。但如果你使用的是预先训练好的模型,而你自己没有训练它们,那么大多数时候你会发现它们所训练的数据集对特定行业并不是特别有用,或者没有你希望的那么深入。对于基于文本的任务(如 NLP 等)来说尤其如此。
在这里,你只需要知道两件事。首先,即使有一个基础也可以。如果你知道,是的,例如,模型生成的元描述不是很好,但它们可以修复。如果你认为,如果你编辑它们,你将更快地生成最终输出,那么你应该为自己感到自豪,你做得很好,因为即使这样,你也节省了大量的时间。如果你认为输出根本没有用,这并不意味着所有的机器学习都没有用。这只是意味着对于这个特定的任务,你使用的这个特定模型没有用。这完全没问题。因为你甚至可以对你的利益相关者或你的客户说,我们测试了几种方法,我们测试了一种自动化方法。由于这个原因,它没有起作用。然后你甚至可以使用模型的输出来与你的团队生成的输出进行比较和对比。因此,在所有情况下,实施或尝试机器学习将使您的案例更加有力。您只需要知道何时说“好吧,我们尝试过,但没有成功”,以及如何利用这一点来为自己谋利。
D:谈到产出,我们首先要考虑第六点,即协同工作并设定合理的期望。
6. 协同工作并设定合理期望
L:最后一步就是要知道你什么时候需要帮助,以及如何获得正确的帮助。在这里,我认为你可以采取一些措施来获得所需的帮助。首先,找到一个机器学习伙伴。一个和你属于同一类型的人。他们在同一个行业工作。他们有同样的问题。你们一起思考、遇到问题,一起研究任务。当有人发现对这个角色有用的东西时,他们会与他们的伙伴分享。这可以帮助你保持责任感,帮助你保持动力,这真的是一件非常好的事情。
另一个解决方案是加入一个部落,比如机器学习部落。我再次请 Jason Brownlee 来发言。他创建了这张图表,对现有的不同机器学习部落进行了细分。对于我们这些 SEO 人员来说,我们要么属于商业部落,因此这些经理可能正在尝试了解自动化或机器学习是否是解决他们问题的正确方法,或者是否可以用于他们的团队,要么属于数据部落,例如,数据分析师正在尝试更好地理解数据。我之所以特别提到这两种类型的部落,是因为如果你身处这样的团体或社区,你就会知道那里的人正在尝试寻找相同类型的结果,但他们解决问题的方法与你的相似。因此,如果你不了解与编码相关的高级概念或机器学习模型背后的数学,你就不会受到审查。你将被非常同情你所面临的挑战的人所包围。这可能是不同的挑战。例如,如果你在一个有 Python 开发人员的社区中,你问为什么我的模型不起作用,结果发现它是一个逗号或类似的东西。你可能会感到更加严格,对你的查询的回复可能会更严厉,我们不想让你感到没有动力。所以这就是为什么我强调要找到正确类型的社区或正确类型的部落。
第三点,我认为无论你选择哪种方法,你都应该应用这一点。那就是,只要你觉得你自己无法解决问题,就应该尽可能联系开发人员。如果你在 StackOverflow 上花了六个小时,却只遇到一个错误,而且你感觉非常没有动力,那就联系某人,有很多非常熟练的 Python 开发人员,甚至在 SEO 社区也是如此。如果你联系他们,他们可能已经遇到过类似的问题,所以他们可能会给你指引。我不是说联系他们,这样他们就可以为你编写脚本。但他们可以为你指明正确的方向。这也可以非常鼓舞人心和激励人心。
D:Lazarina,您说的太棒了。我知道
您可以连续几周谈论机器学习在 SEO 方面的应用。这只是一个简短的介绍。但它确实展示了您的知识。我相信您可以深入研究特定领域。如果您能再来,那就太好了,也许我们可以请您回来,深入研究 Python 在 SEO 方面的应用 ,或者其他一些更小众的话题。
帕累托困境——分析 SERP 以寻找新机会
让我们用帕累托法则结束我们的讨论。帕累托说,你可以用 20% 的努力获得 80% 的结果。你会推荐哪一项 SEO 活动,它能以适度的努力提供令人难以置信的结果?
L:我对此考虑了很多。我想说一些我不常看到的做法。对我来说,那就是SERP 分析。我们有很多机会分析搜索引擎结果页面,尤其是大规模分析。因此,如果你已经完成了关键词研究,并且知道你的网站可能在哪些关键词上排名,哪些关键词没有排名,以及内容差距等等。我想说,如果你可以使用 DataForSEO 之类的工具进行非常大规模的 SERP 分析,那么你就可以很好地了解市场。比如谁在哪里排名,你在与哪些品牌竞争,他们如何构建标题、元描述,他们的内容有多长,以及诸如此类的各种分析。如果在那个层面上,你知道何时何地实施机器学习,那么仅凭这一活动就会影响你的整个内容策略。它会让你走上正轨,让你在以后也能保持竞争力。所以,您只需为特定客户做一次这件事并加以保护,就可以在接下来的几个月内使用它来指导和影响您将要采取的许多其他策略。
D:我真的想深入探讨这个问题。我想继续问你更多问题。但我知道这需要额外半个小时左右的时间,我们现在没有时间这样做。希望我们能在下一期节目中再次见到你。现在,我是主持人 David Bain。非常感谢您参加 In Search SEO 播客。
L:非常感谢你邀请我,David。我很荣幸。