马懂百科:马上就懂的百科知识✊

金朝正

马上懂了的有声百科知识。

Episodes

  1. JUL 3

    JCZ生成引擎优化 GEO:AI 时代的新搜索曝光秘籍AISEO如何让你的内容在AI搜索中脱颖而出?

    00:00 Hello喽,大家好,欢迎收听我们这一期播客啊,然后今天咱们聊一聊如何通过生成式引擎优化来帮助内容创作者提升内容在生成式引擎里面的可见性啊。 00:11 听起来很有意思,对,那我们就直接开始吧,直接进入我们的这个主题啊,来聊一聊到底这个东西是怎么回事儿。 00:16 咱们先聊一聊就是什么是生成式引擎,然后他对于内容创作者到底带来了什么样的挑战。 00:23 嗯,就是生成式引擎,它其实是依托于非常大的语言模型,然后来整合信息,并且总结信息,直接回答用户的问题,嗯哼,所以他的这个回答的质量会更高,也会更加的个性化,那这样的话就会吸引更多的用户来使用生成式搜索引擎,那传统的这种网站啊,或者是内容创造者,他们的流量就会受到影响。 00:49 对,相当于说生成式引擎的出现,直接就改变了。 00:53 用户获取信息的方式,对,没错。 00:57 然后更麻烦的在于内容创作者,他们几乎没有办法控制自己的内容什么时候会被展示,以及以什么样的形式展示,因为这些生成式引擎它都是一个黑盒,而且它变化非常的快,所以这就让很多内容创造者非常的焦虑。 01:15 什么是生成式引擎优化? 01:16 它可以帮我们做什么? 01:17 它的效果到底怎么样? 01:18 就是Guo。 01:19 它其实是一种新的方法,嗯,它可以帮助内容创作者在生成式引擎的这个回应当中提升自己内容的可见性。 01:30 嗯哼,它是一个非常灵活的黑盒优化框架,那我们可以通过它来定义和优化我们的可见性的指标。 01:40 比如说我们可以让他更多的展示我们想要展示的一些内容。 01:45 听起来确实是一个非常对症下药的一个解决方案,对。 01:49 而且我们还开发了geo bench这样一个大规模的基准,它里面包含了非常多的用户的查询以及相关的网络资源。 01:58 然后我们通过实验也证明了geo可以让可见性提升最高40%。 02:05 而且它在不同的领域都有非常好的效果,所以这是一个非常既给生成引擎的开发者,也给内容创作者开辟了一个全新的机会的一个东西。 02:16 那生成式引擎它到底是怎么形成的? 02:19 然后它跟传统的搜索引擎优化又有什么不一样的地方呢? 02:22 嗯。 02:23 ,由多个生成模型和一个搜索引擎协同工作来形成的一个系统,那它会接受用户的一个查询,然后首先会有一些生成模型对这个查询进行一些分解呀,或者是说重写,再通过搜索引擎去找到相关的来源,再通过一些模型去生成这些来源的摘要。就是生成式引擎,它其实是呃 02:51 最后再生成一个最终的响应,而且这个响应里面还会包含内嵌的引文,来确保它的这个信息的可追溯性。 03:00 那它跟传统的搜索引擎优化最大的不同就在于传统的SEO它可能更关注于关键词的匹配,但是生成式引擎它是基于语言模型的,它对于文本的理解会更加的深入,所以它的优化的方式也会更加的复杂。 03:17 对,相当于说生成式引擎是一个多模型协作的一个非常复杂的系统,对,没错。 03:23 所以我们在做GU的时候,我们也是提出了一些全新的印象指标,比如说我们会有一些字数相关的位置调整的这样的一些指标,然后也有一些主观印象的指标,那我们也提出了一些不需要知道生成式引擎内部算法的一些优化的策略,比如说我们可以去改进我们的权威性,我们可以去增加一些统计数据,我们可以去优化我们的流畅性等等。 03:51 那。 03:51 这些都可以非常有效的去提升我们的可见性。 03:54 你们在做这个生成式引擎优化的实验的时候,你们是怎么来设置这个实验环境的? 03:58 然后你们用了哪些评估指标? 04:00 嗯,我们的生成引擎其实我们是用了一个两阶段的设计,嗯哼,就是首先我们会从谷歌搜索引擎里面去获取前5个来源,然后我们会使用GPT super point five turbo来生成答案,我们会用五个不同的温度值来生成答案,取平均来减少我们的统计偏差。 04:19 同时我们还使用了perplexity AI来进行一个额外的评估,来确保我们这个方法是可以通用的。 04:26 对,相当于说实验环境还是比较贴近真实场景的,对,是的。 04:30 然后为了去评估这个,我们还创建了go bench这样一个基准数据集,它里面包含了1万个查询,这些查询是来自于9个不同的来源,它也是按照训练、验证、测试8:1:1的比例来进行划分的。 04:45 同时我们还对它进行了非常详细的标注,比如说它的领域是什么,它的意图是什么? 04:51 啊,等等,我们的评估指标就是我们刚才说的那两个印象指标,一个是位置调整字数,一个是主观印象,我们也会去看它的一些子指标,我们会把所有的分数都进行归一化,这样的话。 05:02 我们可以更公平的去比较这个生成式引擎优化的实验结果到底怎么样,然后它能够给我们带来哪些比较重要的启发呢? 05:10 嗯。 05:10 我们的实验结果就是我们的这些GU方法,在我们的GU bench上面,所有的指标都全面的超越了我们的这个基准方法,嗯,那特别是在引用来源添加配额和统计添加这几个方法上面,我们的这个位置调整次数提升了30%~40%,然后主观印象提升了15%~30%。 05:34 一些文体上的优化,比如说流畅性、易读性也有15%~30%的提升,对,所以这些都是非常高效的一些优化的方向。 05:44 对,相当于说这些优化方法确实可以给网站的可见性带来非常实质性的帮助,对。 05:49 没错,然后我们还发现就是权威。 05:51 地性和关键词填充其实效果并不是特别的好,所以这也告诉我们就是生成式引擎,它并不一定需要你去特别的堆砌一些关键词,或者说用一些非常高大上的词汇,他更看重的是你内容的真实的价值。 06:09 对另外一个我们还发现就是对于排名比较低的网站,Geo的效果会更好。 06:15 比如说我们的引用来源这个方法可以让排名第5的网站的可见性提升超过百分之百。 06:20 不同的G优方法在不同的领域到底表现怎么样,然后为什么我们要去组合这些绩优策略,它到底可以给我们带来哪些好处? 06:28 嗯。 06:28 我们发现就是比如说在辩论和历史这两个领域下面,权威性这个方法的提升是特别明显的。 06:34 然后引用来源这个方法对于事实性的问题是特别有帮助的。 06:38 统计添加这个方法法在法律、政府这种领域下面是特别有帮助的,对于人物、社会这种领域下面也是添加引文是特别有帮助的。 06:48 对,所以这其实给我们的一个启发就是我们可以根据不同的领域来选择不同的优化的策略,对。 06:57 相当于说不同的场景下面其实最佳的时间是不一样的,对。 07:00 没错。 07:00 然后我们还发现就是如果你把不同的GU策略组合起来的话,会有更好的效果,比如说我们把流畅性优化和统计添加组合起来的话,我们会比单个方法的最好的结果还要好5.5%以上。 07:13 我们还发现就是引用来源这个方法如果跟其他的方法组合的话,也会有非常明显的提升,它单独使用的时候并不是特别的好,但是它跟其他方法组合的时候,可以让平均的性能提升到31.4%,所以这也是一个非常好的可以给内容创作者去使用的一个方式。 07:31 在真实的生成引擎上面去做实验,Geo方法的表现到底怎么样,然后它到底意味着什么呢? 07:37 我们在perplexity AI上面做的实验,然后我们发现就是。 07:41 同样的也是添加引文,这个方法是表现最好的,它可以提升22%的位置,调整字数,引用来源和统计添加分别在两个指标上面有比较好的表现,一个是提升9%,一个是提升37%。 07:54 我们的关键词填充这个传统的方法就表现的非常不好,它比我们的机线还要低10%,对。 08:00 相当于说这些结果其实跟你们之前在实验环境里面得到的结果是非常一致的,对。 08:05 没错,所以这个就非常有力的证明了GU方法的有效性和通用性。 08:10 对。 08:10 所以这是一个非常对于内容创作者来说非常好的一个消息,就是他们终于有一些方法可以在生成式引擎下面去优化自己的内容了,而且这些方法是非常简单而且高效的。 08:23 那GU跟其他的一些相关的技术比起来,它到底有什么独特的地方的? 08:27 通过搜索引擎去拿一些来源,然后再去生成答案,但这些方法都是比较零散的GE。嗯,就是在基于证据的答案生成这方面之前的一些方法,要么就是用强化学习让模型去浏览网络,要么就是 08:41 都是第一个把这些东西都统一起来的一个框架,同时它也是第一个提出了非对抗性的策略来优化任意的网站的内容的这样的一个方法,所以它的通用性会更强。 08:55 对,相当于说GU是一个更系统化的一个解决方案,对。 08:59 没错。 09:00 然后在检索增强语言模型这方面,之前的研究主要还是在解决语言模型的内存有限的问题,嗯哼,生成引擎它是一个更复杂的框架,它不光是要生成答案,它还要对答案进行归因,它还要支持多模式的输入和输出。 09:16 在搜索引擎优化这方面,传统的SEO技术它都是基于关键词匹配的,它也没有办法去应对生成式模型的这种复杂的绘

    11 min
  2. JUN 27

    人生玩家,快意人间,香港四大才子之一蔡澜先生离世

    蔡澜:一位活出真性情的人生玩家 蔡澜,这位集制片人、作家、食家、旅行家、画家、篆刻家、鉴赏家、电视节目主持人等多重身份于一身的传奇人物,以其独特的“真性情”和“活一天过一天”的洒脱生活态度,在华人世界享有盛誉,被誉为“香港四大才子”之一。他的人生哲学和生活方式,为无数人提供了启示。 蔡澜的“无所谓”人生态度是如何形成的?蔡澜的“无所谓”人生态度源于他对生死的豁达。他曾经历妻子离世和自己摔伤的变故,却反而觉得这是“好事”,因为妻子没有痛苦地走了,自己也“自由了”。这种直面死亡、不惧无常的心态,让他将“活一天过一天”奉为圭臬。他认为,人生不必过于拘泥和严肃,一切顺其自然,享受当下,便是最好的活法。这种松弛感也体现在他晚年散尽家财、入住酒店式公寓、雇佣8人团队照顾日常起居,以及随时睡觉、打游戏的生活方式中。 蔡澜在美食领域有何独特见解和贡献?蔡澜对美食的热爱近乎痴迷,他自嘲名字“蔡澜”谐音“菜筐子”,注定一生与吃喝结缘。他不仅是高产的美食作家,每周在报刊上发表美食专栏,出版200多本美食书籍,还主持多档美食节目。他深入街头巷尾,发掘人间至味,不爱山珍海味,只专注于朴素食材的精妙。他脑中有“美食活地图”,对世界各地的美食如数家珍,甚至能将文学作品中的虚构菜肴复刻到现实中。他曾担任《舌尖上的中国》总顾问,其“食神”的称号实至名归。他对食物的评价真实不加修饰,甚至有“合照里他笑了就是好吃,不笑就是不好吃”的“潜规则”。 蔡澜如何将个人爱好与商业成功结合?蔡澜巧妙地将自己对美食和旅行的热爱转化为商业成功。他创立了以“去油腻”为卖点的“暴暴茶”品牌,并在日本市场取得成功;他还将澳洲有汽红酒引入香港,并利用自己的专栏进行宣传。此外,他积极涉足餐饮业,创建了“蔡澜港式点心”品牌,并获得大众点评“必吃榜”的认可。他策划的美食旅游团,以品尝当地时令美食为主,吸引了众多“多金一族”,展现了他敏锐的商业嗅觉和对市场需求的精准把握。蔡澜在电影行业积累的商业运作经验,也为他后来的商业探索奠定了基础。 蔡澜在电影行业扮演了怎样的角色?蔡澜是位“影二代”,从小就与电影结缘,14岁便在报纸上发表影评。他留学日本攻读电影专业,后回香港担任邵氏电影公司的制片经理,并受邀加入嘉禾公司担任电影制作部副总裁,在电影行业浸润了四十年。他监制了多部叫好又叫座的动作电影,如《快餐车》、《龙兄虎弟》、《一个好人》等,为成龙的成功做出了贡献。尽管他后来坦言“浪费了40年才发现自己并不喜欢电影制作,爱的只是看罢了”,但能将不喜欢的事做成功,也恰恰证明了他的过人才华。 蔡澜“好色”的特点如何体现在他的生活中?蔡澜对“好色”从不遮掩,认为这是人的天性,无需压抑。他曾公开表示有过61位女友,并在小学作文中畅想开妓院的“美妙场景”,但强调“卖艺不卖身”。他尊重女性,与其接触过的女性都对他评价很高,如李嘉欣赞他“品味最好的男人”,林青霞称他“让成熟女人仰慕的男人”。他将“食色性也”视为人性最本真的一面,剥离一切虚伪的掩饰,活得随心所欲。 作为“香港四大才子”之一,蔡澜的才华体现在哪些方面?蔡澜的才华横溢,远不止于美食。他师从书法篆刻泰斗冯康侯,自成一派,并在北京和香港荣宝斋举办过书法展。他通晓多国语言,曾旅居世界多地。金庸曾评价他“琴棋书画,财色酒气,吃喝嫖赌,文学电影,什么都懂”,并称他于电影、诗词、书法、金石、饮食之道“可说是第一流的通达”。他与金庸、倪匡、黄霑共同主持的《今夜不设防》节目,以其松弛、真性情的访谈风格,创下了超高收视率,展现了他独特的个人魅力和才华。 蔡澜在面对公众和网友时展现了怎样的智慧?蔡澜在面对公众和网友时,展现出一种独特的“人间清醒”和“松弛感”。他会开放微博评论,直接与网友交流,无论是隐私问题还是生活烦恼,他都能给出精炼、诚恳甚至有些“荒诞不经”的回复,常常蕴含人生哲理。他“暴躁”的一面也体现在对“恋爱脑”和不切实际幻想的直接回怼中。他对“躺平文化”的态度是“本该如此”,不加批判,顺势而为。他认为“压力的死对头是好玩”,凡事只要变得好玩,压力自然减少。 蔡澜对待生死和遗憾的态度是怎样的?蔡澜从不避讳公开谈论生死,他认为“人,不一定要生着才庆祝,死了也该庆祝”。他曾受墨西哥将死亡视为解脱的风俗启发,认为人在去世时也可以放烟花庆祝。他曾表示将来死后骨灰要撒在维多利亚港,不留遗憾。他认为,只要在离开这个世界的时候没有留下遗憾,“好好吃,好好玩,好好睡”,便是真正的完美人生。他将感伤锁在保险箱里,用铁链拴住,踹到海里,只将快乐带给别人,体现了他面对生命和死亡的豁达与积极。 马懂百科——图文音视百科全书

    7 min
  3. JUN 26

    金朝正GEO生成式引擎优化AI投喂内容可见性研究探讨

    金朝正GEO:生成引擎优化 GEO: 生成引擎优化 普兰贾尔·阿加瓦尔, 维什瓦克·穆拉哈里, 坦迈·拉杰普罗希特‡, 阿什温·卡利安†, 卡提克·R·纳拉辛汉, 阿米特·德什潘德, 普林斯顿大学 †艾伦理工学院 ‡佐治亚理工学院 印度理工学院德里分校 TLDR: GEO是一种新颖的范例,它将帮助内容创建者针对增强大型语言模型的 下一代搜索引擎优化其内容。 生成引擎 大型语言模型 (LLM) 的出现开启了搜索引擎的新范式,它使用生成模型收集和汇总信息以回答用户查询。这些生成引擎 (GE)具有生成准确且个性化响应的潜力,正在迅速取代传统搜索引擎并提升用户效用。 GEO 是关于什么的? 然而,生成引擎给内容创建者带来了许多挑战: 排名和可见性:在传统搜索引擎中评估网站性能很简单,网站会按排名顺序列出,内容也一字不差。然而,生成式搜索引擎会生成丰富且结构化的响应,通常会将引用嵌入到单个区块中。这使得排名和可见性的概念变得非常微妙且多面。 网站优化:与搜索引擎不同,搜索引擎已对提高网站可见性进行了大量研究,但如何优化生成引擎响应中的可见性仍不清楚。 黑盒特性:由于生成引擎的黑盒特性,内容创建者几乎无法控制其内容的显示时间和方式,这使得优化其内容变得更加困难。 为了应对这些挑战,我们提出了生成引擎优化 (GEO) ,这是一种旨在帮助内容创作者提升其内容曝光度的全新范式。我们提供了各种展示指标、评估基准以及一系列优化策略,帮助创作者在已部署的商业生成引擎上提升内容曝光度。 重点 �生成引擎的内容优化: GEO 允许网站所有者专门针对生成引擎优化内容。 �定制可见性指标:提出针对生成引擎的专门印象指标,以便您可以有效地判断内容优化。 �综合基准:引入 GEO-BENCH,这是一个用于评估的 10K 查询的多样化基准,以及用于与最佳方法进行最新比较的相应排行榜。 ️显著提高可见性:在已部署的商业生成引擎的实验中,简单的 GEO 策略可将可见性提高高达 40%。 结果摘要 GEO 的表现远超基准和传统 SEO 方法。我们分别对提出的生成引擎和实际部署的 GE 进行了评估,以比较其性能。结果显示,创作者可以立即使用 GEO,改进内容,迎接下一次搜索变革�。 我们的分析表明:a.)如果针对目标域名制定优化方法,GEO会更有帮助;b.)未来, GEO将使搜索引擎排名较低的网站受益更多。 我们定性地表明,借助GEO,创作者可以进行微小的更改,但却可以大大提高其内容的知名度。 土工台 生成引擎正成为信息搜索的常用方式,而 GEO 将使创作者能够优化内容。然而,他们如何评估这些方法,如何评估其性能?当前的数据集分散,无法直接代表新范式中提出的查询类型。我们推出了GEO-bench,一个涵盖来自不同来源的生成引擎相关查询的多样化基准测试! 1.地质台 10K 查询: 10K 个查询来自不同的领域、难度和类别。训练集包含 8K 个查询,验证集和测试集各包含 1K 个查询 数据集:由来自以下数据集的基准测试:1. MS Macro、2. ORCAS-1、3. Natural Questions、4. AllSouls、5. LIMA、6. Davinci-Debtate、7. Perplexity.ai Discover、8. ELI-5、9. GPT-4 Generated Queries 来源和标签:每个查询都提供来自 Google 搜索引擎的 5 个经过清理的相关来源。查询带有超过 50 个不同的标签,以便进行有针对性的优化和分析。 2. GEO-BENCH排行榜 公共排行榜:我们为 GEO-BENCH 提供排行榜,并将定期更新最新结果。 不同领域:您的方法针对特定领域?针对不同领域、数据集和标签的排行榜子集。 提交您的方法:将您的方法提交到排行榜并与最佳方法竞争。 在新搜索范式时代促进研究向前迈进了一步! BibTeX @misc{aggarwal2023geo, title={GEO: Generative Engine Optimization}, author={Pranjal Aggarwal and Vishvak Murahari and Tanmay Rajpurohit and Ashwin Kalyan and Karthik R Narasimhan and Ameet Deshpande}, year={2023}, eprint={2311.09735}, archivePrefix={arXiv}, primaryClass={cs.CL} } 模板改编自Keunhong Park 等人编写的Nerfies并使用了Bulma。

    9 min

About

马上懂了的有声百科知识。

You Might Also Like