旗下微信矩阵:

2012移动工具领域最值得关注的创新公司

2012年创新中国总决赛在上周刚刚落下帷幕,我们看到参赛项目从移动互联网到云计算,从时尚创意到先进制造都不断出奇、出新。《创业邦杂志》采访了移动工具、在线教育、游戏、医疗、时尚创意、云计算、电子商务、物联网、清洁技术、海洋运输等10个行业产业领域最引人注目的创新项目,我们将分篇进行报道。
2012-08-30 09:54 · 创业邦 翟文婷 曲琳 郑江波

 智问:不做下一个Siri

  Siri的出现给智问带来了希望,但智问的目标是超越它。 

2012移动工具领域最值得关注的创新公司

朱胜收藏了库布里克执导的全套电影。其中一部《2001:A Space Odssey》(中文译名《2001太空漫游》),讲述了探索太空奥秘的故事。太空飞船上的超级智能计算机“Hal”让所有人印象深刻,它可以听懂人类的语言,有自主行动的能力,而且还有类似于人类的感情,会愤怒也会耍诡计。朱胜认为,Hal象征着人类对“人工智能”(Artificial Intelligence)最早的憧憬。

  他创业七年,一直围绕着人工智能转。中国科技大学毕业,又于1997年硕士毕业于斯坦福大学计算机系的朱胜,留在硅谷工作期间,就看到了美国人对人工智能的追求。2004年他回国创业,上海智问软件技术有限公司(下简称“智问”)是他的第二家公司,刚刚获得了苏创投等机构的1000万元投资。

  2011年底,苹果iPhone 4S上的语音功能软件Siri出现,此时他正在埋头攻克“语音识别”这一关。“人工智能世界研究了60年,一直没有爆发行业。Siri唤起了人们的激情:朝着人工智能这个最终方向,还是有可行性的。”

Siri只是引路者

  Siri是苹果在iPhone 4S上加入的一项语音控制功能,可以提供对话式的应答,通过手机读短信、介绍餐厅、询问天气,或调用系统自带的天气预报、日程安排等应用。为此,朱胜仔细分析过:Siri是*个全球大范围商业化实施的人工智能应用,也是一个巧妙的切入点——它只做手机上的应用控制,如打电话、发短信、找周边餐馆和旅店,本身并不复杂,很容易实现。

  不过,他并不想成为又一个Siri。2005年他*次创业,项目是企业智能管理,利用文字识别技术建立内部知识库,软件面向美国企业;2008年金融危机,他把市场转向国内,开始为国内公司做语义分析服务。他的客户是当时正在茁壮成长的一批中国公司:电商类如淘宝、当当,服务类有如家、携程、7天。智问为它们提供客服机器人,例如淘宝的“淘小二”,当当的“小当当”,协助内部客服与坐席人员处理客服问题。

  坐在后台,看着智问出品的客服机器人一个个上线,他得到了另一个启发:在中国,很多人的生活都很空闲,“简直是花大量时间‘泡’淘小二”!

  直到2011年,客户建议,现在移动互联网这么火爆,能不能出一些手机版本?其中有人还提到了对语音的识别。

  他马上着手研发。Siri虽然有划时代的意义,但是被骂得很凶,因为回答无法臻于*,老百姓的胃口被吊起来了,期望值又出奇地高。沿着这个逻辑,朱胜找到了两个出路:走“高精尖”路线,把语义识别做到更好;另一条路,将“拟人化”与“个性化”结合,把它变成平台或工具,开放给所有人,给每个人定制一个Siri。

  实际上,Siri会将一些知识性问题推给语义搜索引擎Wolfram Alpha,它是朱胜心中语义识别技术的*高手,但都难以做到*。所以他选择了第二条路——让每个人拥有适合自己的Siri。他在网站宣传页上写道:“定制太贵,编辑太难。”智问已有的技术、系统以及知识库可以支撑这种开发。

  新产品即将以移动端App的形式上线。它首先会满足苹果带起来的各种基础功能,然后通过机主的配置以及日积月累的问答行为来推断机主的提问方式、使用习惯,甚至识别音调并感知情绪。页面打开,机主可以看到自己感兴趣的10件事情,例如炒股的主人对手机喊声“看股票”,就可以看到自己手里的那几只股票。为了避免隐私问题,智问坚持不抓取信息,只做被动接收。

  产品的很多特征脱离了人工智能最忠实的追随者——美国人的风格,而是完全中国化。外国人喜欢简洁页面,提问严肃,就事论事;中国人酷爱逗贫,喜欢鲜明对比的颜色。智问的机器人取名“笨笨”,是个小孩的声音,不是Siri的“成熟女性”。它除了帮忙还会为机主找流行歌,如果你无聊时和笨笨打趣“有没有打酱油的歌”,它会直接回答你“慢走”。

  一系列部署还没有结束。智问会与垂直内容提供商,例如论坛版主等进行合作,做成具有语音识别功能的推广App。智问的技术可以用于众多领域,而这本身也在帮助智问积累知识库。

  “我们离Siri越来越远了。我希望做全方位服务,Siri来开头,我们来结尾。”

坚持做“技术提供商”

  目前智问拥有三块业务:智能客服,手机助理和语义开放平台。智能客服是盈利重点,客户可以“领养”一个自己的机器人,其中嵌入一部分同行业积累的通用信息;下一步相当于“二次开发”,智问将其称作“培训”,即让客服人员不停地在上面自问自答,或者提问给系统,有错误再更正,组成一系列问答形式的知识条。朱胜记得,当当网在两周时间内就把“小当当”快速培训完毕上线,里面囊括了上万个问题。

  除智能客服之外,与一些定制产品合作方如电信的分成、平台软件服务方等都可以提供收入,面向大众的App只要拥有流量,还可以通过广告来变现。

  不过,此时Siri的追随者已经跟过来了。在2012年创新中国上海分赛上,共有三家语音识别类企业同场角逐。

  大家各自战略不同,但现阶段都在做技术储备。“长久来看,我们是个技术提供商,有自己的收入,短期内利润不太高,”朱胜对自己在行业中的角色很重视,“如果只是做某个应用,会发现腾讯悬在上面,一旦微信模仿Siri,大家的技术即使再超越Siri也无处可用;用户体验看似是门槛,但这东西又是没有壁垒的。”

  苹果的确给了大家*的时机。“我不会花1亿美元做推广,而苹果花了几亿。”朱胜看过一个美国脱口秀栏目,主持人手持苹果手机,问Siri“今天天气怎样”,Siri回答“你这个蠢货,看看窗外就知道了”。

  “其实Siri不会这么回答,明显是苹果请节目来炒作的,你知道苹果公司有多聪明了吧?我越发坚信我们的运气不错,方向找对了。”

  在攻克文字与语音识别的同时,他也完成了对“语义识别”的过渡。这不仅是抽取“关键词”,而是判断出对方的问法,例如省略、倒装等,举一反三地解答、追问或联想。它就像各类识别的地基:懂得语义后,所有服务将跨越一层台阶。

  “它的原理很符合一个词——知识。‘知’是Knowing,知道答案;‘识’是Recognition,不知道答案,但知道你问的是什么。这很重要。为了达到语义识别,我们需要用‘识’来把‘知’整理好。”他认为这个过程很难,需要反复去粗取精,“我把它称为‘鸡尾酒技术’。”

  “语义识别”技术继续往前延伸将达到“语义搜索”,谷歌正在研发中。通过这项技术,谷歌将向用户提供“猜测的”搜索结果,如果搜索一个城市,会将城市形态、特征、发展历史直接显示出来。“那将需要建立更大的、非结构化的库,打复杂的标签,花很多时间去整理,这就是所谓的Web3.0。有一天它会融入日常生活中。”朱胜说。

【本文由投资界合作伙伴创业邦授权发布,本平台仅提供信息存储服务。】如有任何疑问,请联系(editor@zero2ipo.com.cn)投资界处理。