织梦CMS - 轻松建站从此开始!

高速音码输入法

当前位置: 主页 > 语音输入法 >

人机交互技艺:给文化生活带来无尽可能

时间:2013-04-15 09:37来源:编辑 作者:高速音码 点击:
3月初,三星电子在纽约发布了最新的GALAXY S4智能手机,其中一项名为Eye Scrolling(眼球控制)的技术颇为抢眼。这项技术可以通过手机的前置摄像头来跟踪用户的视线,从而对手机进行简单的操作。 动动眼球,手机屏幕就能自动翻页;手指悬空,网页浏览也能操

  3月初,三星电子在纽约揭晓了最新的GALAXY S4智能手机,期末一项名为Eye Scrolling(眼球垄断)的技艺颇为抢眼。这项技艺可以始末手机的前置摄像头来追踪用户的视线,从而对手机进行简便的操作。

  动动眼球,手机屏幕就能自动翻页;手指架空,网页浏览也能操作自如;动动嘴皮,眼镜还能即时拍摄……这不是什么科幻电影里面的场景,而是正在走进我们生活的技艺创新。

  语音技艺整个走入生活

  在近年来不停浮现的人机交互技艺创新中,除了多点触控之外,最为众人熟知的应该要算语音技艺了,这还得感谢iPhone的推广。2012年,苹果在iPhone上推出了一项名为Siri的语音技艺,在原有的Voice Control(语音垄断)功能上参加了在线云服务功能,将语音辨别技艺整个推向了云时世。其实Siri并非语音交互技艺的开创,早在iPhone面世之前,索尼爱立信就推出Track ID技艺,可以始末录制音乐片段自动在网络上搜索并下载原曲。

  今时今日的语音交互技艺可不只限于音乐搜索那么简便。苹果iPhone上的Siri利用云端服务器的智能化“学习”功能,不停收藏不同用户的爱好并自动优化,在人机互动方面的聪颖劲儿已经让不少用户乐此不疲地“调戏”它。“语音最大的优势是,它是人类最自然的交互方式。”机器学习技艺专家、百度多媒体部副总监余凯说,以语音搜索为例,基于自然语言的搜索企求将会成为搬动互联时世的主流搜索方式之一。“当今的语音搜索不同于传统搜索模式,不是基于无涉及的几个关键词来反馈结局,而是能够知道用户指令,实现一项完整的任务。”

  正是因为在语音交互技艺上博取了这种智能化、云端化的冲破,在里程了20陈年的酝酿准备之后,眼前语音交互技艺曾经开始始末智能手机、平板电脑等不同终端平台大规模进入到一般人的生活。以智能手机为例,眼前提供语音交互的应用曾经非常丰盛,语音搜索、语音输入法、语音导航软件、语音社交软件等大度相关应用不停浮现。在这方面,中国的技艺水均等于靠前。眼前在中文语音交互技艺领域,去年才被中国搬动注资的科大讯飞曾经盘踞了70%上列的市场份额。“国内正在形成联络的语音产业价格链,国内语音技艺的市场应用正在大踏步迈进。”科大讯飞董事长刘庆峰表示,眼前中国在中英文语音产业方面的技艺能耐已彻底和美国等世界一流国家同步。

  “语音技艺是一门穿插学科,它的突飞跃进还得仰仗着数字信号办理、人工智能、大数据合成等各种领域技艺的冲破。”UC优视的CEO俞永福表示,机器要能够精确辨别语音并像人一样始末知道断定作出回应,需要基于大度的“学习”,才干与人一样依据从前的经验进行断定预测。这种“学习”有两种点子:始末在数据中找寻相似事例来提供解决定划,或是始末概况出许多数据样本的共性来对这件事体作出断定,这也是语音技艺发展的难点。所幸的是,近年来大数据和云运算的高速发展大大提高了机器对数据的办理能耐,为机器学习提供了大度“素材”,并且提高了它的学习速度。俞永福预测,在云运算和大数据的有力推动下,将来几年语音交互技艺将会博取爆炸性的发展。

  体感交互逐步走向成熟

  在语音交互走红的同时,另一类创新的交互方式也在渐渐走向成熟,那就是体感式交互技艺。3月初,三星电子在纽约揭晓了最新的GALAXY S4智能手机,作为苹果的最强劲对手,这一次三星居然不曾在硬件配置等方面大做篇章,反而将软件应用和人机交互技艺的创新作为主要卖点,而在三星罗列的众多“足以自傲”的技艺中,一项名为Eye Scrolling(眼球垄断)的技艺颇为抢眼,这项技艺可以始末手机的前置摄像头来追踪用户的视线,从而对手机进行简便的操作。这听起来实在有些不可思议。

  据现场体会了该项技艺的媒体报道,就实用效果而言,眼前三星眼球垄断技艺的成熟度还不是太高,具体体今朝对用户眼球动作的辨识度不够,导致操作的反应不够顺畅,此外也贫乏足够的第三方应用撑腰,只能在三星自家的浏览器等专属应用上完成操控效果,但这无疑为人机交互提供了一种簇新的发展动向。

  当然,对于眼球垄断技艺的实用性,眼前业界还有不少争议。不少专家以为眼球垄断技艺的难点在于机器如何对人类眼睛动作的真实意图进行有效辨别,“有时候众人眨眼或者转动眼球都是无意识的,但机器不见得能够辩白得出来,这样就可能会造成比较多的误操作。”Reational智能实验室的技艺员刘毅直言,就眼前手机摄像头的捕捉能耐和手机的智能运算能耐,眼球垄断的精准性恐怕很难保障。“但这个技艺的前景非常可观,因为如果成熟了的话,就意味着那些四肢有残障或者失去语言能耐的残疾人也能便利地使用搬动智能装备了。”

  相对于眼球垄断技艺的不成熟,同样属于体感交互技艺之一的肢体动作捕捉技艺却曾经开始遍及。这方面,打字,家用娱乐装备厂商可谓急先锋。最早在这方面有所成就的是日本的任天堂公司,其2006年揭晓的Wii游戏机虽然不曾高清的画面,然而却在手柄上大做篇章,撑腰感应人体动作来进行操控,从而让对着电视屏幕打网球成为了一种可能;其后微软推出的Xbox 360游戏机的体感装备套装Kinect更是大获胜利,因为它连传统的游戏手柄也不需要了,玩家只需要对着Kinect套装里配置的摄像头动手动脚就能够完成对游戏的操控,这后面有着进步的动作捕捉技艺的撑腰。

  多模人机交互时世就要降临

  语音交互、体感交互等众多新兴技艺的浮现证明,一个簇新的交互时世就要降临。

  就创新动向而言,眼前交互技艺的革命主要凑集在三个方面,除了前面提到的语音和体感之外,还有穿着式装备,这里面最为驰名的要数谷歌公司就要推出的Google Glass(谷歌眼镜)。这款产品其实是多种交互方式的聚全局,在曾经兜底的功能预告片中,我们看到它集手势、语音、触摸等多种触控方式于一体。之因此会有这样的设计,主要是因为无论是眼球捕捉依旧语音辨别,眼前都还无法完成准确和轻捷的输入,为了弥补这一缺陷,谷歌甚至还专门请求了手套垄断专利,希望始末各种不同操控方式的结合来满意更广泛的需求。

  和谷歌有着相似想法的公司不在少数。眼前加拿大、日本、美国的众多创新公司都在聚焦可穿着智能装备的研发,而要让这些装备能够完成和现有智能终端同样的使用效率,操控方式就务必有所冲破。“打个比喻吧,智能手表的概念今朝很热,然而手表类产品不论是出于携带便利依旧好看的原因,屏幕都没办法设计得很大,这种情况下,多点触控就显得没那么实用了,反而语音、手势捕捉之类的才干更好地搭配这类装备。”刘毅表示。

  微软亚洲研究院语音专家宋謌平以为,将来最志向的人机交互方式应该是多模态的,是许多不同交互方式的无缝结合,用户在不同的处境下,抉择他最喜欢、最适应并且效果最好的方式,更自然地与机器交互。据理解,眼前微软曾经启动了一项名为NUI(自然用户界面)的研究项目,希望凭仗新型的传感器、更强大的运算能耐以及大数据和机器学习,让人类能够始末语音、手势和触摸等更加多元化的方式与运算系统进行互动。

  在追求交互方式多元化的同时,人性化、精准化也是交互技艺下一轮创新的重要动向。2012年,一家名为Leap Motion的公司分外火爆,该公司宣称推出的自有体感操控技艺要比微软的Kinect准确100倍上列,而且零延迟。用户无需使用键盘和鼠标,甚至不需要使用触摸屏,只要隔空动动手指,PC或者平板电脑屏幕上就会产生相应的反应。“我在网上看过这个公司的视频,真的很牛,看起来就像那些科幻电影里的一样。”在媒体就业的钱珊珊表示,她个人对于这款号称将在今年5月13日开售的产品非常感乐趣,“如果有条件的话,一定要买一套回来试试。”

  作者:程鹏起源中国文化报)

(责任编辑:admin)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
发布者资料
DerrickBarrow 查看详细资料 发送留言 加为好友 用户等级:注册会员 注册时间:2013-01-06 23:01 最后登录:2014-11-27 11:11
栏目列表
推荐内容