向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。
这个特别的日子普京单膝跪地,致辞释放三大讯息******
中新网2月3日电 (记者 孟湘君)纪念碑前敬献花圈并默哀,音乐会上发表致辞,会见爱国与青年组织代表……
日前,以这样的方式,俄罗斯总统普京表达了对斯大林格勒保卫战胜利80周年的纪念。
距普京下令俄军对乌克兰展开特别军事行动满一年,只有20多天了。在这样一个战争历史和现实考验交织的特殊时刻,普京的一举一动,自然让西方媒体高度关注。它们希望搞清楚,普京究竟释放了一些什么样的重要讯息。
当地时间2月2日,普京在伏尔加格勒马马耶夫库尔干纪念馆,为苏联元帅崔可夫献花。
第一个讯息:不要忘了历史教训
2023年2月2日,普京前往曾经的斯大林格勒,追忆战争岁月。那里在20世纪60年代,更名为伏尔加格勒。
伏尔加格勒的马马耶夫山岗上,矗立着“祖国之母”巨型雕像,陈设着有长明火的荣军殿。普京步入荣军殿献花,并默哀一分钟,缅怀当年的阵亡将士。
其后,普京前往斯大林格勒战役主力战将崔可夫墓前,单膝跪地,献上鲜花。
俄罗斯伏尔加格勒马马耶夫高地上被点亮的“祖国之母”巨型雕像。
“我们在此庆祝我国乃至全世界历史上一个最具决定性的重要日子。”
“80年前,在斯大林格勒这片土地上,在伟大的俄罗斯伏尔加河河畔,万恶、无情的敌人被永远赶了回去。”
“漫长、艰苦、激烈的斯大林格勒保卫战”已经结束。
在纪念斯大林格勒保卫战胜利80周年音乐会上,普京的致辞,勾起了俄民众对当年那场残酷战役的回忆。
资料图:克里姆林宫墙附近的无名烈士墓。
1942年7月17日开始,次年2月2日结束的斯大林格勒战役,是苏联军队在约10万平方公里区域内与德国法西斯的激烈交战,双方数百万人陆续参战,以苏联获胜告终。
这场战役,因规模、持续时间和参与人数等,被评为二战期间最大战役之一,伤亡人数也创下纪录。俄罗斯卫星通讯社统计显示,纳粹德国损失约150 万人,苏联方面损失约113万人。路透社评价,这是二战“最血腥的战役之一”。
“普京在提醒世界,不要忘了战争残酷的过往”,评论指出,这是他发出的一个讯息,意在提醒和告诫西方一些人,二战的教训应一直被铭记下去。
第二个讯息:不怕西方援乌,俄有后手
不过,引起更多关注的,是普京的另一番话。他在致辞中特别指出,“这件事难以置信,却是事实——我们再次受到带十字的德国豹式坦克的威胁”。
资料图:德国“豹II”主战坦克。
他将此举形容为“现代面目的纳粹主义”,并进一步指出,有人“正将德国拖入新一场与俄罗斯的战争”,“我们一次次被迫击退西方集体的入侵。”
十字标记、德国坦克、纳粹主义……普京点明的这些元素有何含义,以及推动德国松口向乌提供进攻性武器的是谁,再清楚不过了。
1月25日,德国政府宣布,决定为乌克兰组建两个坦克营,第一阶段从联邦国防军库存中,抽调14辆豹2A6坦克交予乌方。
俄一架图-95MS轰炸机前摆放着14枚导弹。图片来源:俄罗斯国防部
对于西方国家对乌供武问题,普京的态度早已摆在桌面上。俄外长拉夫罗夫指出,任何包含乌武器的物资,都将成为俄方“合法打击目标”。普京此次就强烈警告称,“我们有能拿来回应的,事情不是用上装甲车就能结束的”。
至于拿什么来回应,普京没有明说。但无疑,这是在向西方国家隔空喊话:你们的意图我清楚;事情还没结束;俄罗斯还有后手。总之,“走着瞧”。
俄国家杜马主席沃洛金则更直白地放话称,德国派出与俄作战的坦克将面临和80年前德国法西斯坦克一样的命运,那就是被烧毁。
资料图:乌克兰切尔尼夫,一名男子在一辆被毁的坦克旁骑车。
德国联邦国防军退役中校罗斯也对俄卫星通讯社分析,德国对乌克兰这种供武举动,是为保持乌军作战能力和士气“不会彻底崩溃”。
因为其一,耗时间。
罗斯指出,按北约标准训练坦克手操作坦克,至少需一年,坦克本身要按应对乌战事条件的准备交付,也需时间。
其二,数量少。
这一批德国供应的坦克数量为14辆,罗斯不认为用区区14辆坦克,就能扭转战事局面。
其三,耗资源。
他表示,考虑到俄空军正有目的地销毁乌能源基础设施,而德国“豹式坦克消耗的燃料不少,乌军将“遇到麻烦”。
何况,俄军在带自动制导、侦察无人机的反坦克导弹系统帮助下,很容易将德国坦克作为目标瞄准。
罗斯反问道:“除心理影响外,目前的(坦克)交付还能带来什么样的战术价值?”
第三个讯息:新的有生力量、新的动向
在斯大林格勒保卫战胜利80周年纪念日之际,普京还会见了俄罗斯社会爱国与青年组织代表,并发表讲话。
“需要生活在当下并向前看,但是不了解过去就没有未来”,“没有过去记忆的人民不会有未来”,他对参与会见的代表们说道。
普京同时表示,“所有这一切都是我们珍视的,发展和前进的基础”,“我们的首要任务是保护俄罗斯,为其继续发展和强大创造条件”。
当年参与斯大林格勒战役的,不少是十多岁、二十多岁的年轻人,而一项全俄社会舆论研究中心的调查曾显示,超过30%的俄罗斯年轻人对这段沉痛的历史,知之甚少。
资料图:俄罗斯二战老兵亮相斯大林格勒保卫战纪念活动。有分析认为,普京选择在纪念日之际与爱国与青年组织会谈,一方面是表达历史需要当代青年加深认识和传承,一方面也是为俄在乌军事行动的大规模动员造势,培养新的有生力量以弥补战场损失。
1月时,俄国家杜马国防委员会主席卡尔塔波罗夫曾表示,该国2023年春季征兵时,可能将年龄条件放宽至30岁以下。
按乌防长列兹尼科夫的说法,俄方已动员多达“50万名士兵”,尝试在2月24日对乌行动满一年之际,发动“新的重大攻势”。
列兹尼科夫称,莫斯科准备以此“纪念”俄在乌开展特别军事行动满一年。而俄方并未置评。至于新“攻势”何时到来,乌克兰局势会不会就此迎来重大转折,或许不久就能知晓。(完)
(文图:赵筱尘 巫邓炎) [责编:天天中] 阅读剩余全文() |