《科技创新与品牌》杂志社品牌·汇

百度演绎创新的“二元方程式”

新首页会基于用户行为和兴趣建模,并根据机器算法和机器学习,向用户智能推荐最想要的信息、应用或服务

  创新是什么?“创新就是将价值和实现手段的新组合成功地引入到业务中,以更好地实现企业使命和战略目标。”这是百度首席产品架构师孙云丰向笔者作的精辟描述。
  在孙云丰看来,这种重新组合表现成三种形态:一是价值本身就是全新的,比如电视机、Facebook等具有全新价值的产品。二是老价值+新手段,即产品和服务的价值是旧的,但其实现的方式、模式是全新的。例如,最早汽车发动机是蒸汽机,后来是煤气发动机,然后是内燃机,现在则正在尝试使用油电混合。三是老价值+老手段,但它们的组合是全新的。
  按照孙云丰的解释,如果把创新的过程看作方程式,那价值和实现手段便是方程的两个变量。从最初的搜索框,到框计算,再到新首页以及LBS等新形态产品,百度的发展史将这个创新的二元方程式演绎得淋漓尽致。这样的创新之道与创新精神,便是百度成为全球最大中文搜索引擎公司的重要推动力。

搜索+UGC模式:新组合孕育新价值

百度首席产品架构师孙云丰与百度人探讨创新的方式

  百度的“搜索+UGC(用户创造内容)”模式曾被人津津乐道,这正是孙云丰提到的第三种创新形态的重要体现。孙云丰表示:“搜索不是新事物,UGC也不新鲜,但搜索+UGC的组合却是全新的,这样的新组合使搜索效果大大提升。”
  不过,搜索+UGC模式的出现也并非凭空想象。众所周知,最初的搜索是将网络中的网页抓取来,并展现在搜索结果中。“如果用户需要的信息在互联网上根本就没有,搜索引擎又如何挖掘出来提供给用户呢?”百度产品副总监田晓萌道出了搜索引擎发展中的问题所在,“不仅如此,有些东西也很难通过搜索引擎搞定。比如,用户想寻找描述春天的诗词,虽然搜索引擎可以去抓取网络中的诗词,但却很难断定检索到的诗词是否是描述春天的。”
  一边是用户对知识类信息的强烈需求,另一边是网络上内容缺乏及内容与需求间难匹配的问题,面对这样的新矛盾,百度人集智聚力,开始探索解决之道。经过内部不断讨论,思想的火花最终碰撞出了一条创新思路:既然缺乏内容,那就搭建平台,让用户在平台上创造内容。

百度CEO李彦宏与技术人员共同探讨Hackathon(百度举办的编程马拉松比赛)上诞生的创新成果 

  2003年,百度CEO李彦宏提出了此前其他搜索引擎公司都没有意识到的理念—社区化搜索产品理念,提出搜索引擎与知识类社区产品相结合的战略方向。在该战略思路的指导下,百度贴吧、百度知道、百度文库先后面世,并巧妙地与搜索引擎结合在一起,打造出了全新的价值。
  “以百度知道为例,它很好地实现了两方面的价值。”田晓萌解释道,“一方面它可以把存在于用户大脑中的信息挖掘出来。另一方面即便搜索引擎能在网络上抓到这些信息,有时也很难针对用户的需求,反馈最适合的答案。而在百度知道里,有问有答,可以说用户帮搜索引擎做了问题与答案的对接。而百度搜索引擎就可以基于百度知道中的信息,直接反馈用户所提问题的答案。”
  如今,百度知道上每天有超过25万个网友在线提问,近100万个网友在线贡献答案,累计解决超过2亿个问题;而百度百科也已经收录了超过460万个词条,并以每天超过2000个新词条的速度快速“成长”。这一切正在为百度搜索引擎实现“让人们最平等便捷地获取信息、找到所求”贡献力量。

框计算:深度变革搜索产业

  创新并非一蹴而就,而是在循序渐进的演变过程中逐步成型的,百度框计算的发展史就演绎了这一过程。框计算的诞生体现了第二种创新形态—老价值+新手段。搜索并非新鲜事物,但百度却运用新的信息获取方式、展现方式,大大提升了搜索效果。
  2004年时,用户在百度搜索框中键入“3+3”,搜索结果页面会直接反馈答案“6”。随后,针对用户的定义类需求,百度将能够解释这一定义的百科类页面排在了搜索结果页面的前几位。但那时,这种根据用户特定需求,以更佳的展现方式反馈更精细信息的理念还局限在很窄的需求范围内,并没有得到扩展。
  到了2007年,由于用户对图片搜索的需求变得愈加强烈,百度搜索引擎又做出相应改变。孙云丰说:“假如用户在搜索框中键入搜索词时,我们分析出用户想要搜索的是某位明星的照片,百度搜索结果页面就反馈该明星的相关图片,同时将图片放在搜索结果页面第一或第二的位置上。但这仍是用传统的方式建立索引,改变的仅是呈现方式而已,且成本非常高。”为此,百度人更深入地思考,如何才能以更优的方式、更低的成本让用户精准、快捷地找到所需的信息。
  2008年,百度成立专门小组,决定在这个方向上投入更多的资源和人力,把事情做大。最终,在百度高层和小组成员的努力下,框计算的理念应运而生,并形成了需求识别、优质资源的准备、优质资源的调权,以及按需展现四个基本逻辑框架。
  定下框架不到一个星期,李彦宏找到了相关团队。孙云丰说:“当时李彦宏告诉我们,现在准备的资源都是一些可控资源,非常有限,我们应该做成开放平台,让更多的资源接入进来。”李彦宏的一句话,使框计算理念上升到了一个新的高度。
  然而,框计算毕竟对传统搜索进行了重大革新,因而在其思路定下来后,百度人的心里仍旧有些忐忑。不过,“让人们最平等便捷地获取信息、找到所求”的使命使他们坚定了前行的步伐。

  实现框计算的其中一大要务便是需求识别,这看似简单,其背后的技术难度却不容忽视。据介绍,在“用户需求识别”技术上,百度经过不断研究,已成为全球当之无愧的领导者。这一技术旨在确定用户究竟要互联网为自己做什么,是互联网科学最复杂和最具技术含量的一个领域,包括语义分析、行为分析、智能人机交互、海量计算处理等子领域。例如,用户想从互联网得到一个“形容很开心的句子”,这个请求首先会被拆成不同粒度的20个语义单位进行分析,之后,后台经过3亿次计算来识别这个需求,并在上百亿个网页资源中检索,进行需求分配,整个过程要在不到十分之一秒内完成。

百度副总裁王梦秋在百度世界大会上表示,建立数据开放平台将改变互联网生态


  与此同时,除了研究、发展相关技术,开放平台的建设也在快速推进。百度副总裁王梦秋表示:“搭建数据开放平台是一个能够改变互联网生态的行动。其实,能在网上被搜到的信息只占人类信息的很小一部分,我们应该把更多的信息数字化,用一个中介把用户需求和人类信息的‘暗网’对接起来,争取尽可能多地拥有向百度开放的数据。这将会大大提高用户获取信息的质量和便捷性。”
  数据开放平台的出现,实现了即搜即得。例如,当用户登录百度,搜索某两地间火车时刻表时,框计算会直接返回时刻表。
  需求在变,创新亦无止境。百度开放平台部技术经理刘建国表示:“随着互联网的发展,我们发现很多网页都变成了Web App(网页应用),用户对App的需求也变得越来越强烈。”于是紧随数据开放平台之后,百度又搭建了应用开放平台。“这不仅为应用开发者找到了用户,同时也能让搜索结果更好地满足用户需求,这是一个共赢的结果。”
  如今,用户在搜索框中搜索应用,搜索结果页面会直接返回应用,用户可以直接使用,这就使即搜即用的理念得以实现。据悉,目前开放平台已拥有应用及数据合作伙伴超过7万家,上线应用超过8万个,并且这一数目还在快速增长。这些数据和应用资源将为百度框计算的发展提供充足的“动力”。

新首页:了解用户,实现不搜即得

  框计算的即搜即得、即搜即用改变了信息获取的方式,大大提高了效率:如果将用户平均筛选信息、点击并进入下一级页面过程按5秒计算,那么框计算每年大约能为网民省下14亿个小时。但这样的成就并未让百度人放慢创新的脚步,一个想法出现在了百度人的脑海里,如果把搜索过程省去,不是能为用户节省更多时间吗?
  于是,百度新首页诞生了。在传统的搜索框下,百度新首页增加了导航、实时热点、新鲜事等模块。互联网上的信息、服务、应用,可以以用户喜欢的方式,集成在百度的新首页上。同时,新首页拥有智能推荐功能,会基于用户行为和兴趣建模,并根据机器算法和机器学习,向用户智能推荐最想要的信息、应用或服务。新首页的出现体现了第一种创新形态,即全新的价值,不搜即得、不搜即用。
  一直以来,百度人总是站在用户的角度,思考用户需要什么,新首页的诞生正是如此。负责新首页的百度高级产品经理侯建彬说:“我们主要从两个角度来思考如何做新首页,第一是用户的刚性需求是什么。百度人通过调研、讨论,发现这个需求是网站,大部分用户是要去访问网站的。”
  但是,只是简单地提供用户需要的网站远远不够。田晓萌告诉笔者:“我们现在不是在提供网站,而是在做‘需求簇’。比如某用户是一个韩剧爱好者,我们就要考虑为其提供韩剧的排行榜、追剧看视频的功能以及相关贴吧。”在田晓萌看来,“需求簇”的展现方式能更好地满足用户需求。
  侯建彬表示:“第二个思考便是我们通过什么方式将网站提供给用户,答案是通过行为挖掘等技术来实现。”但行为挖掘等技术需要依托具备强大科研实力的团队来实现,为此,百度任命了国际计算语言学学会(ACL)首位华人副主席、享有全球盛誉的科学家王海峰为百度基础技术首席科学家。他带领着全世界最大的NLP(自然语言处理)团队,悉心钻研基础技术、前沿科学,以先进的研究成果支撑起了百度一系列产品的发展,其中就包括新首页。
  为伦敦奥运会所设计的新首页,可以说是百度的一次重要尝试。据悉,为了建立奥运会的“需求簇”,百度人分析了大量数据,了解了用户对奥运的最大需求,并最终确定奖牌榜、赛程赛果和视频为用户三大需求。确定需求点后,百度人接下来便开始寻求展示内容和展示效果的最佳结合点。田晓萌表示:“我们通过不断试验、修改与完善,最终使得相关内容能够在非常小的模块内被最优地展现。”
  奥运版的新首页上线后,其效果远远超出了田晓萌的预期。“产品要上线时,我并未料到产品效果会有这么好。当时团队的同事说能达到某个效果,我还觉得不一定能做到,结果却大大出乎我的意料。”田晓萌笑言,“这从侧面反映了一个事实—在百度,我们就是要充分地调动一线员工,去创新、去实践,集大智慧做大事儿。”

LBS产品:打造移动时代的生活入口

  说到“麦兜”,恐怕许多人都会想起动画片里那只可爱的小猪,而在百度,“麦兜”也很有名,因为它是百度LBS(基于位置的服务)团队的团队名。这个名字来源于该团队的一个口号—“Map(地图)的事情,由我们‘兜着’”。
  百度之所以要“兜着”地图服务,亦是用户需求变化与产业发展过程中的必然选择。
  2009年,百度推出了满足基本地图搜索、交通出行需求的地图服务。但随着移动互联网时代的到来,麦兜团队发现了市场上的新变化。
  “当时,我们团队的研发、市场人员总在一起看日志,研究外部产业发展趋势。”百度LBS产品总监沈丽指出,“通过长期的观察和分析,我们发现用户的需求不再局限于位置信息,而是产生了对消费决策信息的需求,如‘我应该去什么样的饭馆’等。”更细致地说来,用户对地图的需求已从基本地图搜索、交通出行扩展到了生活需求,以及基于位置的更多服务,如位置交友服务等。
  “行业在蓬勃发展,机会亦不断涌现,百度的地图服务也要应需而变。”麦兜团队当机立断。
  通过分析产业环境,并结合百度的业务特点和优势,麦兜团队看清了百度地图服务的发展方向—百度地图要成为移动互联网时代,用户寻找生活服务信息的独立入口,即从出行工具变为生活的入口。
  基于这样的新定位,麦兜团队朝着这个方向全力前进,打造了一系列LBS产品。例如,今年6月百度推出了拥有餐饮、酒店、房产、医疗、生活服务、休闲娱乐等众多频道的生活服务平台。这样的服务说起来简单,但其背后却是由百度长年积累的强大技术和数据资源支撑着。
  百度高级技术经理顾维灏自豪地告诉笔者:“我们拥有其他服务提供商难以拥有的优势,其中之一就是需求识别。基于百度在搜索引擎上积累的技术,现在用户搜索‘中关村小学’,我们的系统就能很好地理解用户到底是寻找中关村附近的小学还是中关村小学。”
  此外,百度还拥有庞大的POI(兴趣点)数据,目前已拥有上千万的POI数据。顾维灏表示:“和商家合作是数据来源之一,但百度的优势是可以通过索引互联网上的网页,借助篇章主题分析等技术,将网页中的内容精确地摘出来,形成相关数据库。”
  实际上,百度为“让人们最平等便捷地获取信息、找到所求”而打造的创新产品远不止上述提到的这些,还包括MP3搜索、生活助手等近百种产品。据当时负责MP3搜索研发的陈韫敏介绍,百度打造出了全球最大的中文MP3搜索引擎,可以让用户便捷地找到最新、最热的歌曲,其中的“音乐掌门人”更是为用户提供了一个音乐分享平台,用户可以在上面发布个性专辑,分享自己喜爱的歌曲。
“从传统搜索发展到智能的框计算,从即搜即得跃变至不搜即得,从单纯的地图搜索延展到手机上的LBS产品……我们一直在追随时代的步伐和用户需求,不断创新。”百度技术委员会理事长陈尚义告诉笔者,“我们内部近期还连续举办了两期Hackathon(编程马拉松)比赛,让百度人发挥想象去打造创新的产品。CEO李彦宏每次都参与其中,与技术人员共同探讨创新成果,这使得创新的文化得以进一步深化。”
  纵观百度的发展史不难看出,一个企业要想获得成功,不仅要营造浓烈的创新氛围,更要善于培养和利用员工的创新思维。这些年来,百度用自己的努力向世人诠释了创新的真谛,那就是坚守信念,不断根据用户需求和产业环境变化,不拘一格开辟新路,创新产品。百度,正在向世界演绎着创新的“二元方程式”。