TXT的跨年舞_得到App首席数据科学家分享：为什么知识服务以程序员为本？

最近TXT的跨年舞_得到App首席数据科学家分享：为什么知识服务以程序员为本？事件在热度非常高，为大家准备了完整关于TXT的跨年舞_得到App首席数据科学家分享：为什么知识服务以程序员为本？事件的所有相关内容，如果大家想知道更多这方面的情况，请持续关注本站！

得到App首席数据科学家分享：为什么知识服务以程序员为本？

### 得到 App 首席数据科学家杨溥的演讲：为什么知识服务要以程序员为本

大家好，我是杨溥，得到的首席数据科学家。在过去十年里，我一直在从事与人工智能相关的工作。今天，我想和大家分享我们团队在知识服务领域的一些思考和实践。

#### 一、为什么知识服务要以程序员为本？

大家都知道，得到是一家知识服务公司，专注于课程、电子书和跨年演讲等内容。去年，我们的创始人提出了一个梦想——建立一所为终身学习者服务的通识教育大学。这个任务交给了我们程序员团队。

你可能会问，为什么建学校这件事不是交给老师或班主任，而是交给了我们程序员？这是因为历史上的每一次知识大爆炸，背后都有工程师的身影。蔡伦发明造纸术、古腾堡发明印刷术，这些技术革新都极大地推动了知识的传播。现在，我的工作就是用我们这一代的技术，解决未来的学习问题。

显然，这一代的技术离不开人工智能的支持。说到人工智能，它已经渗透到我们生活的方方面面。然而，现有的智能推荐系统并不总是符合学习的需求。例如，外卖平台会连续几天推荐日餐，电商平台会在你购买运动服后继续推荐同类商品。这种基于用户行为的推荐方式，在学习领域并不适用。

如果一个用户已经在得到上学习了长时间的《薛兆丰经济学》，我们是否应该反复给他推荐经济学的内容？显然，这样做会让他的首页永远只显示同一类内容。而得到的用户是一群对未知充满好奇心的人，他们渴望探索不同的领域。因此，我们需要一种全新的方法来满足他们的需求。

#### 二、什么是“得到大脑”？

今天，我想介绍一个内部称为“得到大脑”的项目。这个项目的目标是通过技术手段改善大家的学习体验，就像给我们的大脑增加了一个外挂。

前不久，我接待了一位得到的重度用户。她告诉我，最初她是被薛兆丰的经济学课吸引进来的；学完经济学后，她开始对金融学感兴趣；当看到非理性的股市时，她又想去了解心理学对决策的影响；之后，她转向了更底层的生命科学，并因为对生命产生了敬畏，开始学习天文学。她的学习历程就像一团小火苗逐渐变成熊熊烈火，点燃了她的探索之路。

每个人的学习路径都会有所不同，但探索不是搜索。得到大脑的目标不是做一个更好的搜索引擎，而是帮助每个用户展示一个可以自由探索的知识世界。我们希望，借助机器的力量，给每个人配上一个学习助理，从各个维度主动整合相关信息，再传达给你。

#### 三、认知智能与知识图谱

目前，以深度学习为主的人工智能技术被称为感知智能，它还无法完成这样的工作。我们需要达到认知智能的水平，即让机器“能理解，会思考”。而知识图谱是实现认知智能的核心技术。

知识图谱的概念最早由谷歌在2012年提出，主要用于提升语义搜索能力。今天，当你搜索“C罗的生日”，不仅能看到关键词匹配的结果，还能看到具体的生日日期、百科介绍以及他在球队中的统计资料。

有了知识图谱，结合虚拟现实技术，我们可以想象未来的学习场景。例如，你想了解苏东坡。你可以跟着他的脚步，知道他哪一年走出四川，哪一年走进开封，哪一年被贬黄州，哪一年写了《赤壁赋》。每一年遇到什么样的人，做了什么样的事，写了什么样的诗词。过往学者对这些内容的研究，以及它们与你当前所在地点的关系，都可以一一呈现。

在这个过程中，如果你对王安石产生了兴趣，你可以跳转到他的视角，开启新的知识探索。整个过程，你不是在学习苏东坡，而是在代入苏东坡的角色。

#### 四、如何构建面向学习者的知识图谱？

确定了技术方向后，下一步是如何构建一个面向学习者的知识图谱。

首先，需要确定知识图谱的构建范围。在知识服务领域，我们将围绕“通识教育”和“学科教育”构建领域知识图谱。

接下来，我们需要填充知识图谱的内容。主要包括两部分：第一部分是以“知识点”为中心的实体内容，如专业术语、历史人物、著作等；第二部分是这些知识点之间的关系内容。

这些内容需要借助大量的自然语言处理技术，甚至辅助一定的人工手段，从海量的结构化数据和非结构化的文本中挖掘出来。例如，对于知识点的挖掘，我们会用到“领域词挖掘”、“命名实体识别”等技术；对于关系的挖掘，我们会用到“事件抽取”、“关系抽取”等技术。

为了保证知识的质量，我们还会结合“知识融合”技术，消除歧义信息，确保只有高质量的知识进入图谱。当知识达到一定量级后，就可以开始知识的探索之旅。

借助“实体链接”技术，机器拥有了“理解”的能力。当你提出一个问题，问题中的信息就会与图谱中的信息链接起来，你可以在其中任意穿梭，发现一个又一个有兴趣的关联。

#### 五、个性化学习路径的打造

除了理解知识，我们还需要让机器懂你、了解你，让你知道先学什么、后学什么。这就像当你想快速学习一个新领域时，你会找到该领域最专业的朋友进行沟通，因为他既懂专业知识，也懂你。

因此，“得到大脑”的第二个目标是研究如何为学习者量身打造合适的学习路径。

首先，我们需要挖掘知识的脉络结构，比如知识点的前后依赖关系、上下位关系、从简单到复杂的递进关系等。我们正在与国内高校团队合作，从高质量的图书中挖掘这些关系，并将它们构建成“知识树”。