财经相对论

复旦金融评论
财经相对论

让深思熟虑平易近人

Episodes

  1. 06/19/2024

    E0301. 对话张奇:从实验室到市场:大模型产业化之路

    高校所承担的角色更多地是进行技术验证,即探索技术路径的正确性和可行性;而大模型产品化需要企业的介入。 | 嘉宾 | 张奇 复旦大学计算机科学技术学院教授、博士研究生导师,“眸思”(MouSi)大模型负责人,MOSS大模型核心人员 | 内容 | 从MOSS到“眸思” 复旦金融评论:2023年复旦大学自然语言处理实验室发布了国内首个类ChatGPT模型MOSS,您作为该团队的核心成员,能否分享一下团队是如何实现这一突破的?是因为研究的预见性,还是因为团队在执行上展现出了非凡的速度和效率? 张奇:首先,ChatGPT不是一夜之间就出现的。早在2020年,GPT-3就已经发布了。当时,我们就开始与多家企业展开合作,着手进行相关的预训练工作。在2021年,我们就已经与合作伙伴共同推进了相关项目的发展。得益于这些技术积累,当2022年底ChatGPT发布时,我们能够迅速调动已有的技术快速响应。 其次,我们的实验室在国内自然语言处理(NLP)领域一直处于领先地位。自20世纪90年代起,我们便开始深耕NLP研究,对NLP的各个方面有着深刻的理解和前沿的认知。这也是为什么ChatGPT一问世,MOSS就能够迅速在算法上复现的原因之一。 复旦金融评论:在MOSS发布后,仅用半年时间,多模态大模型“眸思”横空出世。MOSS和“眸思”的模型有何关联? 张奇:MOSS和“眸思”是由我们实验室开发的两个不同的模型。MOSS是一个对话式大型语言模型,而“眸思”是一个多模态大模型,能够理解并识别图片内容。这也意味着我们实验室的研究从原本基于GPT3.5的文本模型转向围绕GPT4-v复现多模态大模型。 随着“眸思”项目的推进,我们开始思考它还能做些什么。“眸思”多模态的处理能力(联合语言和视觉的力量)就像是为MOSS增添了“一双眼睛”。只需拍摄一张照片,“眸思”就能准确描述出周围的环境。这一特性启发我们将“眸思”模型应用于辅助视障人士的公益性项目。想象一下,视障人士只需用手机拍张照片,“眸思”就能告诉他们前面有没有障碍物,或者周围有什么重要的事物,帮助他们更方便地“看清世界”。 从实验室到市场:产学研融合下的大模型产业化 复旦金融评论:作为一个高校研究团队,“眸思”在资金投入和研发产出方面如何实现平衡?除了公益性质的项目,未来是否有计划做市场化的盈利项目? 张奇:在大模型的研发和产业化过程中,资金投入是非常大的。不过,得益于2023年与企业的一些合作,我们对大模型的能力边界有了更深入的理解。这也帮助我们在后续的产业项目中能够更加明确大模型的潜力和应用范围。 实际上,真正在“眸思”项目的资金投入相对较少,并且研发团队也少走了一些弯路。“眸思”的核心工作是验证研究路径的可行性,也就是确定我们能够达到的技术高度、模型的优势与局限、是否具有商业可行性,以及如果落地所需的资金规模。在这一过程中,我们并不需要巨额资金从零开始对模型进行预训练,也不会使用千亿参数规模的大模型。 我们利用实验室内部已有的积累,包括之前项目的结余资金来以一种可持续的方式逐步推进研发,这就类似于一个滚动发展的过程。一旦“眸思”完成,可能吸引更多企业合作,尤其是在多模态领域。这一方面增强我们产品落地的能力,另一方面也推动我们的研究和开发工作,从而形成良性循环。 另外一个“眸思”目前主要在做的项目是为个人和企业提供知识问答服务。用户可以在单卡3090这样的硬件上,利用我们的“智工”知识问

    28 min
  2. 06/26/2023

    E0201. 对话丁磊:从AIGC的飞轮效应,到伟大的商业模式

    AI思维的底层逻辑——其基础在于数据,核心在于模型,实现在于算力,具体应用在于业务场景。 嘉宾:丁磊 人工智能商业化落地先行者、历任百度金融首席数据科学家、PayPal全球消费者数据科学创始负责人、《生成式人工智能》作者 策划/采访 | 潘    琦制作/视觉 | 葛雯瑄 数据、模型、业务形成飞轮效应 《复旦金融评论》:ChatGPT等人工智能机器人通过交互界面走进大众视野。而实际上人工智能的概念早在1956年达特茅斯会议就诞生了,当下人工智能所用的算法也是上个世纪五六十年代就有的。为什么发展和应用了这么多年的决策式AI没有像生成式AI(或AIGC)引发这么大的轰动效应?丁磊:作为一名从事模型相关工作近20年的人,我认为有必要先简要介绍一下什么是模型。模型是人工智能通过从数据中不断学习和总结得出的一种类似于人脑的思考方式,可以将其理解为知识和逻辑的数字化载体。与存储数据或信息的数据库不同,模型更接近人类的思维过程,通过分析和推理来完成各种任务。人工智能发展了这么长时间,最近才引起了更大的公众层面关注,可能是因为现在的模型发展到了一个新的阶段。现在的这些大模型,如GPT-4,已经初步具备了成年人的通识和逻辑能力,我们可以利用这些模型研发大量的相关应用。从这一角度来说,人工智能对人类社会的生产和工作具有重大意义。《复旦金融评论》:在2020 年的专著《AI 思维》和最近的这本《生成式人工智能》中,您提到目前可以观察到的人工智能应用只是人工智能领域的冰山一角,那么您认为冰山的内核是什么呢?丁磊:2020年《AI 思维》这本书更多关注的是决策式AI,而我们现在新的大模型主要是生成式AI。这两者可以看作是人工智能的两个主要分支。无论是哪种人工智能,我认为其内核都是AI模型驱动的运营模式。换句话说,人工智能的内核是基于数据、模型、业务三者的相互作用所形成的飞轮效应。也就是说,随着数据的不断积累和模型的持续训练,模型的智能程度不断提高,进而在业务中产生更大的价值。而在业务的运行过程中,又会积累更多的数据来训练模型,从而数据、模型、业务之间形成了一种正反馈的飞轮效应。就像是一个飞轮不停地转动,数据越来越多、模型越来越聪明,业务所带来的价值也会越来越大。因此,基于这种飞轮效应可以构建出伟大的商业模式。例如,亚马逊、天猫的推荐引擎可以有效促进消费者的购买行为;字节跳动捕捉到目标受众的需求和兴趣的能力越来越强,抖音推荐的内容越来越精准,让人“上瘾”;自动驾驶通过数据的自学习反馈变得越来越智能,可以实现无人员干预的价值;当前非常流行的图片生成工具,如Midjourney,其团队虽然很小,但却通过数据和模型的正反馈的效应,使其生成的图片越来越符合人类需求。《复旦金融评论》:您能不能为我们再解释一下,为什么到了生成式人工智能这样兴起的一个阶段,会有这样的一个正反馈效应?随着生成式人工智能的兴起,人工智能领域是否会加速发展?丁磊:飞轮效应并不仅限于决策式AI或生成式AI。实际上,它是人工智能的一种本质学习属性,可能带来正反馈机制。但要实现这种效应,须建立完整的数据、模型、业务闭环,否则效应难以实现。展开来说,决策式AI更像是在做选择题,分类是它的强项。人脸识别就是一个典型的案例,决策式AI对实时获取的人脸图像进行特征信息提取,再与人脸库中的特征数据匹配,从而实现人

    32 min

About

让深思熟虑平易近人

You Might Also Like

To listen to explicit episodes, sign in.

Stay up to date with this show

Sign in or sign up to follow shows, save episodes, and get the latest updates.

Select a country or region

Africa, Middle East, and India

Asia Pacific

Europe

Latin America and the Caribbean

The United States and Canada