Watson

catkin
catkin
catkin
1323
文章
112
评论
2014-11-25
评论
368 次浏览
IBM最新的电脑系统Watson,它运算更快,记忆力更好,它也懂一些人类语言中的暗喻和双关。
Watson得名于IBM创始人Thomas J. Watson,开发的目的不是为了参加比赛,而是为了解词汇、语言和人类知识中的更复杂领域。
为摹仿人脑,并在Jeopardy节目中有竞争力,沃森装载了大量文档,包括各种辞书和文集,还有《世界图书百科全书
在读取问题之后,Watson就动用数据库,以不到五秒钟的时间钻研超过2亿页的内容。研究人员开发了一个算法来衡量沃森在回答问题时的把握程度,以确定它是否应该按下蜂鸣器。

牵头开发Watson的IBM科学家Dave Ferrucci表示,人工智能是完全不同的一种飞跃,一台电脑不知道作为人类会是什么感觉。
2011年2月14日,史上最强的人机对抗拉开序幕。Watson,将参加美国智力节目Jeopardy,挑战两位人类选手Ken和Brad。
负责开发watson的8所大学,以及所负责开发部分是:
Massachusetts Institute of Technology (MIT) 的计算机科学以及人工智能实验室。它负责基于Adaptive View-Based Appearance Model的实时追踪计算开发。
University of Texas,它负责的部分是自动推理以及常识知识研发。
University of Southern California,它负责的是信息的提取以及分析。
Rensselaer Polytechnic Institute (RPI), 它负责的是虚拟化工具。
University at Albany, 它负责的是大量问题的QA系统运行能力保证。
University of Trento, 它负责这套系统的自我学习,以及人机会话能力。
University of Massachusetts, 它负责信息检索能力研发。
Carnegie Mellon, 它负责Watson QA系统的基础算法。
超级电脑沃森”由IBM公司和美国德克萨斯大学历时四年联合打造,电脑存储了海量的数据,而且拥有
一套逻辑推理程序,可以推理出它认为最正确的答案。"沃森"(Watson)是为了纪念IBM创始人Thomas J. Watson而取的。IBM开发沃森旨在完成一项艰巨挑战:建造一个能与人类回答问题能力匹敌的计算系统。这要求其具有足够的速度、精确度和置信度,并且能使用人类的自然语言回答问题。这一系统没有连接至互联网,因此不会通过网络进行搜索,仅靠内存资料库作答。

沃森的未来

美国哥伦比亚大学医疗中心马里兰大学医学院已与IBM公司签订合同,两所大学的医疗人员将利用沃森更快、更准确地诊病、治病。它的海量信息库中存有许多发表在期刊上的专业论文,可以让医生利用最新科研成果治疗病人。想要让沃森真正成为医生的得力助手,还需要对它进行改进。医生需要的不只是一个答案。而且有时病人提供的信息不准确或相互矛盾,这就需要医生利用丰富的经验进行判断。IBM研发小组接下来的挑战是,让沃森多提供一些假设情况,研发小组至少还需要两年才能完成这一任务。

从“深蓝”到“沃森”?

14年前,IBM研发的计算机“深蓝”(Deep Blue)战胜了国际象棋冠军卡斯帕罗夫;现在,这家公司以创始人Thomas J. Watson名字命名的计算机,继续着对人类智能极限的挑战。IBM长于制造各种复杂的机器,除了服务器还有这种智能计算机(小型机的集群),它看起来可不仅仅就像那句有点讽刺意味的流行语说的那样—IBM,不是个生产哲学的公司吗?在1960年代人工智能的技术研发停滞不前数年后,科学家便发现如果以模拟人脑来定义人工智能那将走入一条死胡同。现在,“通过机器的学习、大规模数据库、复杂的传感器和巧妙的算法,来完成分散的任务”是人工智能的最新定义,这早已经取代了曾经甚嚣尘上的“重建大脑”。按照这个定义,沃森在人工智能上被认为又迈出了一步。“深蓝只是在做非常大规模的计算,它是人类数学能力的体现,”IBM中国研究院资深经理潘越告诉《第一财经周刊》,他同时参与沃森项目,负责提供数据支持。“当涉及到机器学习、大规模并行计算、语义处理等领域,沃森了不起的地方在于把这些技术整合在一个体系架构下来理解人类的自然语言。”如果这些解释有点晦涩难懂的话,那么可以参看一下《危险边缘》的游戏规则,你便知道沃森的价值何在。《危险边缘》是哥伦比亚广播公司一档长盛不衰的电视问答节目,自1964年开始播出,最精彩的地方在于游戏里的问题包罗万象,几乎涵盖了人类文明的所有领域。它的规则是答对问题可以获得奖金,答错就会倒扣。对人类来说,规则很简单,但对沃森来说,则意味着众多挑战。首先沃森必须要听懂主持人的自然语言,这是深蓝不具备的;其次是沃森需要分析这些语言,比如哪些是反讽,哪些是双关,哪些是连词,随后根据关键字判断题目的意思,沃森进行相关搜索,并评估各种答案的可能性;最后选择三个可能性最高的答案,当其中一个可能性超过50%后,程序启动,沃森按下抢答器。这些得以实现靠的是90台IBM服务器、360个计算机芯片驱动以及IBM研发的DeepQA系统。IBM为沃森配置的处理器是Power 750系列处理器,这是当前RISC(精简指令集计算机)架构中最强的处理器—这些得以支持沃森最终得出可靠答案的时间不超过3秒钟。沃森主打的是小型机的并行运算。IBM在大型机上的地位很难撼动—在小沃森(创始人老沃森的儿子)执掌IBM时期,IBM投入约60亿美元,这笔超过当年NASA的研发经费,最终把日本NEC法国的克雷排挤出去,奠定了IBM在大型机市场的垄断地位。“在IBM的内部员工培训上流传着一句笑话,那便是在大型机领域,有97%的市场份额来自IBM,剩下的3%来自淘汰的IBM二手大型机。”IBM服务器销售部门前负责人告诉《第一财经周刊》。IBM试图把大型机上的优势带入到小型机领域。沃森主打的正是IBM的销售新星90台小型机的并行运算,“IBM小型机的运算速度是突出的,”上述IBM员工评价说,“因为它把大型机的CPU研发优势直接移植到小型机上来了。”IBM是为数不多的可以有能力独立开发小型机CPU的厂家,IBM还将这些技术出售给了除英特尔以外的芯片制造商。现在,在小型机市场上,IBM与HP的市场比例大致为2:1,另外一家小型机公司SUN则现在主要针对低端市场。此外,IBM的全球研发团队的某种模式也加大了沃森赢得比赛的可能。这些团队分工极为细致,比如以色列海法团队负责深度开放域问答系统工程的搜索过程,日本东京负责沃森在问答中将词意和词语连接,IBM中国研究院和上海分院则负责以不同的资源给沃森提供数据支持,还有专门研究算法的团队以及研究策略下注的博弈团队等。“我们就好像是每个不同的虚拟部队,每个人只做自己最擅长与熟悉的那部分。”潘越称。事实上这便是IBM的特色,它一直遵循工业时代的成功模式,比如这种制造企业更为擅长的流水线模式,并且通过给员工分级打分的奖惩制度,让它的各个团队都更有效率。这些研发天才开发的DeepQA系统保证了沃森可以具备崭新的人机交互模式,比如可以理解并分析自然语言,事实上,对自然语言的理解也一直是IBM研究机构在人工智能上的强项。这很像科幻电影里的桥段—为了隐秘的机器人开发计划,在全球招募天赋异秉的人士。所不同的是,IBM的意义显然更为实际。此前,基于深蓝研发的AIX操作系统让IBM在商业运用与政府部门中取得了大量的订单,IBM也希望可以将沃森的DeepQA系统运用于医疗服务、咨询等领域之中。 “沃森的优势是给出准确与可靠的答案,因此可以为医生提供更适合病人的解决方案。”潘越称,“在医疗领域的应用将是沃森商用最主要的领域。”沃森项目如果想在医疗行业推行的话,还需要面临法律层面的问题,IBM一位研究员称,“如果沃森诊断出错,而医生又听从了错误的诊断,那么沃森就会面临被患者告上法庭的危险,这对IBM而言是一个正在考虑的应用问题。”对于IBM来说,沃森未来不仅要继续挑战人类智能的极限,还要帮助这家公司去同亚马逊谷歌微软们竞争,争夺未来科技制高点的主导权。
  • 我的微信
  • 这是我的微信扫一扫
  • weinxin
  • 我的微信公众号
  • 我的微信公众号扫一扫
  • weinxin
catkin
  • 本文由 发表于 2014-11-25
左手大拇指食指捉一个,单手抓俩个,还没死 真天赋

左手大拇指食指捉一个,单手抓俩个,还没死

百度搜索还没做好呢,搞成平台公司了,这强网易饭碗啊!哪有这样讲英语的,这意思我可以成立青仙无语言俯了。念书三灭第一灭就是灭师,老师的最高成就是教出比自己厉害的徒弟,像黄梅五祖传慧能,有情来下种,因地果...
梦幻舞步再现江湖 創造力

梦幻舞步再现江湖

“这可能是我最难忘的一个时刻之一了,”保罗谈到奥拉朱旺的这个进球时说,“我对大梦说,如果你在你现在这个年龄还能用这样的脚步动作进攻的话,那么我实在是无法想象当年你的风采。”
你真的想她吗 創造力

你真的想她吗

05年,我为了使异地的她知道我在想她,想可以造一心灵语言仪,当我想她时让她知道我在想她,她也是。同时,当我想时,我所想的直接就可以输出,我想她的样子,可以直接显现出来,我就不用画了。我想时,想说的话就...
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: