大家好,我是作业盒子刘夜,人工智能以前跟我个人距离比较远,2014年我们做在线教育的时候当时找到联想之星,当时我们想法很异想天开,这个事情大家比较熟悉,大家上学的时候从小到大是题海战术过来的,我们简单测算了一下,一个中学生从初一到高三差不多平均下来做十万道题,也许是比较好的学生会深 刻意识到其实很多题对你个人而言是挑着做的。如果我们真的做个性化学习和自适应学习,要解决两个问题,一个是数据问题,一个是场景问题,其实这两个是同一个问题。第一天我们就做了一件事情,最早的时候公司还没注册,我们就说要有一个超级工具,老师用它来布置作业,学生来提交作业,我们获得数据之后,我们可 以基于数据去做数据挖掘,并且设置相应的机制和策略,让老师从布置作业开始就能够做到个性化,学生练习的时候每个学生做的作业都不一样。当时语言比较朴素一点,今天来看实际上就是我们所说的AI,靠AI进入到某个特定领域来改善某个领域的效率。
发展到今天,我们用一年时间打磨产品,产品上线推了两个学期,现在每一天产生学生作业数据有4000-5000万条,每个月以30%-50%的环比 速度增长,每一天有六七十万学生在上面提交作业,每一天都有四五万老师在上面布置作业。我们成立不到两年时间,下一个月能够推出基于我们积累60亿条学生 答题数据,基于这个数据可以帮助老师提供个性化作业,帮助学生提供中国最早的一款能够支撑自适应学习的产品。所以某种意义上很多时候如果人工智能有场景、有数据,人工智能离你非常近,如果没有数据、没有场景,或者缺了一点,人工智能相比就离你很远。某种意义上印证了一句话:如果把算法比喻成火箭的引擎,数 据就是原料。人工智能是从什么地方获得原料,以及获得原料后到底能不能发射这个火箭,这是我们这一年多以来创业的感受。
我们见了很多圈里的很多创业者和投资人,这个热潮总体上虚火大于明火的,资本太多、概念太多,但是创业者不够用。为什么这么说?实际上真正有场景、有产品,有能够切入到场景产品的创业者,或者真正有数据的创业者是比较少的,或者说这有一个交集,首先你懂人工智能,懂人工智能的还得有数据、有产品,还 需要有产品可以切入。很多是懂人工智能的专家没有切入的产品。反过来很多人有一些产品上的切入点,但是可能没有人工智能的size,比如我们很多的创业者 都是清一色的海归,特别豪华的团队,有很好的算法、很好的经验,我们问一个问题,你有数据吗?没有,数据怎么来。很多人可能说我有数据,通过什么机构得到 数据。我说有数据之后怎么办呢?怎么用呢?做一个人工智能的自适应学习,我们问在哪用?谁愿意用?还得有工具,我们再找人做工具让大家在上面学习。这在产 品上要有新的飞跃,随便某一个环节,可能第一个环节搞定了,第二个环节是最难搞定的。好比说我拥有中国所有的关系链,所有的通讯录,中国移动可能会有,但是怎么用上呢?说我要做个微信,这个事情就是一个新的飞跃。如果没有微信怎么办呢?我可以群发短信告诉你,你不是喜欢LV等等。这个可能就没有效果。所以 你得有人工智能相应的技术,有相应的数据、相应的产品,相对而言你的产品所在的场景,包括你所能获得的数据可能是人工智能最关键的。这里面最关键的是场景。相对而言,场景有了数据就有了,有了场景、有了数据以后,才可能把数据有释放的通道。像美国有一个企业做了人工智能很多年,其实他没有场景,所以他就 是一个2B的,做了很多年也做起来了,因为美国有大量的产业链相对上游的企业能帮助他实现。所以某种意义上我们听到很多谈人工智能的算法,但是很少有人谈。
我成功的达到了引发一个话题的效果。所有的事情都是可以一分为二的,没有问题的,前面俞老师从不同的层面阐述了一下。
通过这个话题可以看出来,人工智能这个事情,前面几个老师把人工智能不同层面的问题讲的很清楚了。整体上来看,为什么说总体上是一个伪热潮呢?热潮 本身更多的需要创业者本身一代一代生长出来,人工智能领域包括很多产品,包括很多场景,包括数据,包括创业者的诞生,尤其是这个层面,并不会因为资本的加快,它迅速加快,因为资本的原因,过去几年每年的速度到今天可能快一点,但不会像社会资本热潮快那么多。相对而言,我们冷静看待,不管这个热潮本身表面上 怎么看,本身会根据自己的速度发展,资本可能会催生一些。比如滴滴打车、今日头条,可能某种意义上通过某一类的场景或者某一类的产品,一下子把大量的车包括乘客聚拢在一起,需要大量的数据和场景应用,这些应用可能会极其加速整个人工智能继续往前发展,如果没有这些东西,速度可能相对而言不会今天觉得它火了 就火起来。今天大会之前我恶补了很多人工智能的文章,看到很多新闻讲的都是概念,很少听到某某领域的公司因为某某场景的颠覆,像滴滴打车、今日头条这样获得大量的行为数据,大量的场景可以应用,我认为只有场景和应用的产生才能极快的加速它的发展,这是整体从非功能层面看待这个问题。
顺着前面俞老师的话,实际上我们得看,在人工智能当下你这个产业的阶段,到底是产品稀缺还是技术稀缺,这个还不太一样。交通领域某种意义上,滴滴打 车一开始招的肯定不是人工智能专家,招的肯定是地推人员和APP人员,因为要把产品做出来,让司机装上,让乘客跑起来。到一定阶段以后,我们从第一天的时 候也会被投资人问到,你们没有什么自适应学专家,未来怎么做人工智能呢?我们当时说了一句话:“人工智能专家是跟着数据走的,如果某一天你拥有了某个领域里面最好的应用场景和数据,找几个专家来是不难的。”其实某种意义上教育领域从第一天的时候,如果想的稍微远一点,如果一旦场景的缺失,靠这种是补不过来的。从一开始我们在K12里面有很多公司在做扫题,学生一扫获得答案,从互联网的思路来看也是对的,我就获得很多流量。但是如果通过这种扫答案的方式最后做这种自适应学习可能有点问题,从场景来说,实际上是两个问题,一个问题是你获得数据的准确性够不够,因为你扫答案的时候不知道这个学生是真的不会还是他 不想做作业,这是很大的问题。反过来一类的公司在做考试,当然你的数据质量很高,但是考试的数据的密度和连续性够不够,这是很大的问题,学习有同步性的,很多时候我们提供自适应学习是基于学生同步教学来提供这种推荐。但是考试是一个综合结论性的数据,在同步的时候很难推。第二是作为考试公司是给学校送很多 扫描仪进去。所以是可以得到学生的一定数据,假设数据密度够,质量也够,当然考试质量是很不错的,但是有数据以后,对学生来说,它是否真的是说因为你的自适应学习引擎你会提高10%-20%的效率,或者少做10%-20%的无用题,学生是否会真的做。因为从用户感知层面来讲,如果没有这部分很自然的场景,如果没有习惯用高德导航,即使有些东西帮你躲避拥堵,很多时候你不会用它,很多时候是因为你有习惯之后,在这个习惯的场景下基于一个超级的APP,你顺带 提升20%的效率,你可能会使用这个功能。一开始我们选了半天,如果有办法用一个超级的APP,老师每一周、每一天都在上面布置作业,哪怕有50%- 60%的数据流过它,有50%-60%的作业的场景用它来接管。学生提交作业的时候,其实这个场景某种意义上来看,从数据的获得,包括数据的应用本身都很自然。所以我在去年在Gate大会的时候说了一个场景的力量,用一个简短的语言是说“行于所当行,止于所不可不止”。就是当我用人工数据解决问题的时候, 我是自然而然发生的,并不会做多余的动作,不会因为这个东西是人工智能而去做,一定要融入生活当中。
K12做的事情首先看到一定不会是算法驱动,美国他们也做了这么多年,最终在K12还不是很普及,更多是厂商API的服务,如果我们真的能够在国内 首先有一个微信这样的超级APP,大家通过它做一个电子化能够实现的话,反过来别的领域的人工智能专家过来也一样可以做自适应学习的引擎,是能够做得出来 的。在很多的应用领域,早期的时候产品型的机会和创业者在人工智能里面能够最早的时候抓到一拨机会。
谈到不确定性,其实我们先思考一个什么叫确定性,未来什么是已经确定的。因为这也是我们从一开始做这个事情的前提。现在大家看报纸,“今日头条”已 经实现个性化,文字作为里面的元素,纸张作为载体,电子化是必然的趋势。读新闻纯电子化,最后个性性就能实现,因为有了移动终端。相对而言,我们再来看教育这个市场,首先所有的题库是可以电子化、结构化,这是确定的。
第二,中国学生基于题为中心做训练,高考想得到更高的分数是确定的。我们认为早晚有一天,把所有的题库电子化之后,做个性化学习、自适应学习也一定 是确定的,所有人都想得到更好的分数,所有人都想在同样的时间内得到更高的训练效果,这是确定的。什么是不确定呢?其实从第一天的时候我们想这个事情,我 经常花大量的时间看国外的电子墨水技术,它的电子墨水的表层覆了一层的液晶LCD,并且通过蓝牙可以跟移动终端做通讯。再进一步的话,未来有没有可能进学 校,学生专门用的纸张会变成电子墨水,或者直接接LCD配上蓝牙,这是不确定的。最大的不确定我觉得有两个“大”,一个是概率上的大,一个是影响上的大。 更多的是要看影响上的大,这个东西哪怕概率不高,但是对你的企业是颠覆式的、毁灭式的,有可能是飞跃式的,这种不确定其实尽可能关注,如果这个东西即使产生了,但是不是爆发式的,是逐渐产生的,也不要害怕,保持关注就好了。所以说到不确定的时候,引用贝索斯说的一句话,你要看到未来十年什么是确定的,在这 个地方投入,因为不确定性下面是没有答案的,只有担忧。确定性的东西其实会告诉你,你今后三年、五年的投入,投入到未来十年一定不会变的事情上去。这是我对不确定性方面的理解。
五年以后我们希望成为一家用游戏和人工智能可以真正改变教育的公司。怎么改变呢?举个例子,我们小时候玩过三国志,从小的时候就有这个理想,这是最早的理想。人们在玩大海时代的时候,我们可以记住每个港口,每个地方的特产,每个地方相对的历史、政治的内容,玩三国志的时候可以记住人的特性、年代和相 应的历史事件。我们今天既然有这么多的小朋友用我们的终端。两三年以后我们可能是有四五千万中小学生的这么一个公司,他们每天用的终端练习是什么样的终端,这个终端一定是将学习的整个的过程可以靠游戏的方式融入进去,把老师也拉进来,老师只是游戏里面的一个角色而已。人工智能怎么发挥呢?你在做游戏当 中,比如用游戏记英语单词,就知道每个人的曲线,这个单词怎么记,什么时候记什么单词,什么单词已经记住了,什么单词其实没有真正记牢,所有的过程都可以用机器实现、推送,这个机器不会很远,希望四五年以后希望把绝大多数的学科、内容、题型都可以靠游戏在人工智能的方式去实现,让中国绝大多数的小朋友不会 因为中国教育的体制导致兴趣上的差异。我常常说兴趣是真正教育最大的不公平,要靠游戏的方式先改变每个学生的学习兴趣,再用人工智能的方式使差异不那么大,某种意义上学霸可能还是学霸,学渣还是学渣,但是他们的距离可能不会那么遥远。
本文来源投资界,原文:https://news.pedaily.cn/201607/20160710399353.shtml