首页 > 热点资讯 > 正文

TXT的跨年舞_得到App首席数据科学家分享:为什么知识服务以程序员为本?

2025-01-23 13:32 来源:网络

最近TXT的跨年舞_得到App首席数据科学家分享:为什么知识服务以程序员为本?事件在热度非常高,为大家准备了完整关于TXT的跨年舞_得到App首席数据科学家分享:为什么知识服务以程序员为本?事件的所有相关内容,如果大家想知道更多这方面的情况,请持续关注本站!

TXT的跨年舞_得到App首席数据科学家分享:为什么知识服务以程序员为本?

得到App首席数据科学家分享:为什么知识服务以程序员为本?

### 得到 App 首席数据科学家杨溥的演讲:为什么知识服务要以程序员为本

大家好,我是杨溥,得到的首席数据科学家。在过去十年里,我一直在从事与人工智能相关的工作。今天,我想和大家分享我们团队在知识服务领域的一些思考和实践。

#### 一、为什么知识服务要以程序员为本?

大家都知道,得到是一家知识服务公司,专注于课程、电子书和跨年演讲等内容。去年,我们的创始人提出了一个梦想——建立一所为终身学习者服务的通识教育大学。这个任务交给了我们程序员团队。

你可能会问,为什么建学校这件事不是交给老师或班主任,而是交给了我们程序员?这是因为历史上的每一次知识大爆炸,背后都有工程师的身影。蔡伦发明造纸术、古腾堡发明印刷术,这些技术革新都极大地推动了知识的传播。现在,我的工作就是用我们这一代的技术,解决未来的学习问题。

显然,这一代的技术离不开人工智能的支持。说到人工智能,它已经渗透到我们生活的方方面面。然而,现有的智能推荐系统并不总是符合学习的需求。例如,外卖平台会连续几天推荐日餐,电商平台会在你购买运动服后继续推荐同类商品。这种基于用户行为的推荐方式,在学习领域并不适用。

如果一个用户已经在得到上学习了长时间的《薛兆丰经济学》,我们是否应该反复给他推荐经济学的内容?显然,这样做会让他的首页永远只显示同一类内容。而得到的用户是一群对未知充满好奇心的人,他们渴望探索不同的领域。因此,我们需要一种全新的方法来满足他们的需求。

#### 二、什么是“得到大脑”?

今天,我想介绍一个内部称为“得到大脑”的项目。这个项目的目标是通过技术手段改善大家的学习体验,就像给我们的大脑增加了一个外挂。

前不久,我接待了一位得到的重度用户。她告诉我,最初她是被薛兆丰的经济学课吸引进来的;学完经济学后,她开始对金融学感兴趣;当看到非理性的股市时,她又想去了解心理学对决策的影响;之后,她转向了更底层的生命科学,并因为对生命产生了敬畏,开始学习天文学。她的学习历程就像一团小火苗逐渐变成熊熊烈火,点燃了她的探索之路。

每个人的学习路径都会有所不同,但探索不是搜索。得到大脑的目标不是做一个更好的搜索引擎,而是帮助每个用户展示一个可以自由探索的知识世界。我们希望,借助机器的力量,给每个人配上一个学习助理,从各个维度主动整合相关信息,再传达给你。

#### 三、认知智能与知识图谱

目前,以深度学习为主的人工智能技术被称为感知智能,它还无法完成这样的工作。我们需要达到认知智能的水平,即让机器“能理解,会思考”。而知识图谱是实现认知智能的核心技术。

知识图谱的概念最早由谷歌在2012年提出,主要用于提升语义搜索能力。今天,当你搜索“C罗的生日”,不仅能看到关键词匹配的结果,还能看到具体的生日日期、百科介绍以及他在球队中的统计资料。

有了知识图谱,结合虚拟现实技术,我们可以想象未来的学习场景。例如,你想了解苏东坡。你可以跟着他的脚步,知道他哪一年走出四川,哪一年走进开封,哪一年被贬黄州,哪一年写了《赤壁赋》。每一年遇到什么样的人,做了什么样的事,写了什么样的诗词。过往学者对这些内容的研究,以及它们与你当前所在地点的关系,都可以一一呈现。

在这个过程中,如果你对王安石产生了兴趣,你可以跳转到他的视角,开启新的知识探索。整个过程,你不是在学习苏东坡,而是在代入苏东坡的角色。

#### 四、如何构建面向学习者的知识图谱?

确定了技术方向后,下一步是如何构建一个面向学习者的知识图谱。

首先,需要确定知识图谱的构建范围。在知识服务领域,我们将围绕“通识教育”和“学科教育”构建领域知识图谱。

接下来,我们需要填充知识图谱的内容。主要包括两部分:第一部分是以“知识点”为中心的实体内容,如专业术语、历史人物、著作等;第二部分是这些知识点之间的关系内容。

这些内容需要借助大量的自然语言处理技术,甚至辅助一定的人工手段,从海量的结构化数据和非结构化的文本中挖掘出来。例如,对于知识点的挖掘,我们会用到“领域词挖掘”、“命名实体识别”等技术;对于关系的挖掘,我们会用到“事件抽取”、“关系抽取”等技术。

为了保证知识的质量,我们还会结合“知识融合”技术,消除歧义信息,确保只有高质量的知识进入图谱。当知识达到一定量级后,就可以开始知识的探索之旅。

借助“实体链接”技术,机器拥有了“理解”的能力。当你提出一个问题,问题中的信息就会与图谱中的信息链接起来,你可以在其中任意穿梭,发现一个又一个有兴趣的关联。

#### 五、个性化学习路径的打造

除了理解知识,我们还需要让机器懂你、了解你,让你知道先学什么、后学什么。这就像当你想快速学习一个新领域时,你会找到该领域最专业的朋友进行沟通,因为他既懂专业知识,也懂你。

因此,“得到大脑”的第二个目标是研究如何为学习者量身打造合适的学习路径。

首先,我们需要挖掘知识的脉络结构,比如知识点的前后依赖关系、上下位关系、从简单到复杂的递进关系等。我们正在与国内高校团队合作,从高质量的图书中挖掘这些关系,并将它们构建成“知识树”。

接着,我们要在这棵知识树上找到用户的定位。对于老用户,根据他们的历史阅读记录和搜索记录,了解他们对知识点的掌握情况,并映射到对应的知识树中。对于新用户,我们提供一些标签入口,让用户选择感兴趣的领域,然后不断收集他们的行为记录。当用户了解了自己的定位后,学习上就可以更容易地进行取舍。

#### 六、展望未来

未来,当你带着问题来到得到,AI会为你找到相关知识并在小范围内呈现给你。当你面对一个新领域,不清楚该学习什么时,AI会为你推荐合适的学习路径。

你可能要问我,什么时候能用到这些东西?现在我还不能明确告诉你。但我能明确的是,当你用上这些功能时,我们已经在探索更远的方向了。

刚才的技术细节可能不太好理解,但这没关系。实际上,我们正在努力做的这件事,就是为了让你的探索更加自由。

谢谢大家。

关于TXT的跨年舞_得到App首席数据科学家分享:为什么知识服务以程序员为本?的介绍就到此结束了,不知道你从中找到您需要的信息了吗?如果还行了解更多这方面的信息,记得收藏关注多特软件站!

了解更多消息请关注收藏我们的网站(news.duote.com)。

文章内容来源于网络,不代表本站立场,若侵犯到您的权益,可联系多特删除。(联系邮箱:[email protected]