向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。
唐风渡鲸涛 真心鉴真情******
作者:吴为山(中国美术馆馆长)
有史以来,求法传法的中国僧人前赴后继,代代不穷。他们艰难跋涉于漫天黄沙、皑皑雪山,辗转漂流于碧波万顷、惊涛骇浪,用生命和信仰铺就了人类精神和文明交流互鉴的大道。东渡日本传法的唐代高僧鉴真,正是其中的代表。
鉴真像 吴为山/作
一
鉴真俗姓淳于,公元688年出生于江阳(今江苏扬州),14岁时出家,46岁成为一方宗主,持律授戒,名满天下。733年,日本僧人荣睿、普照僧慕名来到扬州大明寺,恭请鉴真赴日“为东海之导师”。
鉴真被日本僧人请法的真切意愿感动,慨然应邀,翌年初夏即欲启程,却因行动泄密未能成行。同年,鉴真率众再次举帆东航,惜渡船被风浪袭毁而迫返。其后第三、四次东渡又连遭失败。748年初冬,鉴真第五次东渡,竟被暴风从东海吹到海南岛。返途经过端州时,日本弟子荣睿病故。鉴真哀恸悲切,忧劳过度而致双目失明。眼前世界遁入黑暗,但鉴真不堕其志,传法之心弥笃,以一片精诚感化天地,终于第六次东渡成功,到达了日本九州。此时的鉴真已经66岁。
鉴真将唐代《四分律》和天台教义弘传于日本,为上至天皇下至众僧授戒,奠定了日本佛教的戒律和教法基础。由是起,日本始有正式律学传承。755年2月,鉴真进京(奈良)入东大寺。日本孝谦天皇下诏敕授其“传灯大法师”位,任命他为“大僧都”,统理僧佛事务。759年,鉴真率弟子在奈良建成日本律宗祖庭唐招提寺,后即于该寺设戒坛传律授戒。千余年间,唐招提寺遭遇地震等灾害无数,至今依然屹立,乃日本国宝。据《唐大和上东征传》记载,随鉴真赴日人员中,有专擅各行业的才俊。如精于琢玉者、精于雕塑者、精于镌碑者、精于建筑者、精于医药者,精通书画者亦不在少数。他们将唐代最先进的建筑、造像、医药、园艺等技术传入日本,成就了日本天平时代的精神文化屋脊——“天平之甍”。公元763年5月6日,鉴真于日本奈良面西坐化,享年76岁。鉴真圆寂后,中日两国很多官员、僧人、居士、文人都曾作诗称颂,其不朽之功绩为中日两国人民的友谊史册书写了灿烂的篇章。
二
2019年,时任日本驻华大使横井裕先生邀请我创作《鉴真像》雕塑,以推动中日文化交流,增进两国友谊。我本人表示,愿意向日本东京都捐赠。此事随即得到了日本驻华大使馆、日本外务省、东京都、中国驻日本大使馆以及东京中国文化中心的关注与支持。2022年3月,我与东京都知事小池百合子女士共同签署了雕塑捐赠协议,确定《鉴真像》于中日邦交正常化50周年在东京正式落成。
我曾经创作过不少高僧大德像,如开凿世界艺术之瑰宝云冈石窟的高僧昙曜;在南京雨花台设坛讲经说法而感得天雨赐花的云光法师;乐山大佛的第一代建造发起者海通法师;同样东渡扶桑传法弘道的隐元禅师;才华冠绝却责己綦严的弘一法师;笔墨纸砚因缘度人、慈悲广布的茗山法师、圆霖法师;兴办教育,慈善济世的真禅法师等。
鉴真与他们,既有相同亦有不同。
相同处,他们都是一种精神性存在。鉴真大师的身形,可塑造成一座山、一口钟、一方石,如浑金璞玉,清凉超尘,精严净妙,朴拙中见风骨,以无态备万态。
不同处,鉴真像有独特的个人样貌,也能折射特定的时代风神。先说时代风神。有唐一代,富庶繁华、热情开放、气度雍容、活力四射。城乡内外,宫廷上下,大街小巷,随处可见诗人、舞者、乐师、画家。泱泱中华,处处充满生机动感,以海纳百川的包容姿态透现着蓬勃旺盛的创造精神。如果用一种艺术技法、一种艺术风格来表现唐代,写意无疑是最合适的。因此,我决定用写意的手法与风格表现鉴真身上蕴涵的唐风。但同时,又有一对矛盾摆在了我面前。即:作为一位得道高僧,个人心性的“静”与时代风神的“动”应如何统一?我要做的,是动静有法。
鉴真是律宗大师,从戒律精神入手,最为合适。戒律的本质,不是呆板,而是活泼——让慈悲心活泼,帮助众生身心安乐。戒律,可让人得禅定。红尘泛舟,心在静中。安耐毁誉,八风不动。同为律宗大德的弘一法师曾说:“律己,宜带秋气;律人,须带春风。”鉴真授戒律人,亦如春风。塑其像,“风”可为审美意象,但前提是不能影响整体之“静”。于是,我为鉴真像设计了一个站立船头临海凭风的情境:面对大海风高浪急,大师收视反听,绝虑凝神,如如不动,飘起的宽大袖袍裹挟着浩荡唐风,仿佛海波扬帆,与如山、如钟、如石的岿然身体形成鲜明的对比。
但“风”之于鉴真,绝不仅限于形,更在神!此神,落实在人、在民族、在文化。鉴真是一位地道的中国高僧,长期浸淫于儒家“君子之德风”“风以动之,教以化之”等传统观念氛围,其与佛教体验人间忧苦的菩萨行相结合,使“风”既有现实情境,又有文化濡染,还有佛性真如之映现。此“风”虽动,却源于静,祥和安宁,一派生机,郁郁勃勃。而鉴真渡海的坚忍不拔,实为面对“风”却不改坦然、淡然和释然之境界——思忖向来萧瑟处,是非成败皆为空。这,便是我动静有法的入手处。
再说个人样貌。所幸鉴真大师竟有真实样貌传世!日本奈良的唐招提寺至今保存着千年之前制作的鉴真坐像。其弟子据师尊坐化后形象,用一种称为“干漆夹苎”的技法制成,而该技法也是由鉴真传至日本。我所创作的鉴真样貌,主要以此坐像为参考依据:高凸的山根下,鼻直而宽厚,与广额通连。慈眉如月,双瞳微闭,神态坚定。
整尊鉴真像,躯体雄健伟岸,衣褶单纯厚重,轮廓简约、劲健、洗练、明确。由上至下,没有丝毫混浊,似水银泻地,若顿悟般爽然决然。由下至上,宛攀山登峰,如恪守戒律,步步艰难却步步明确,通过真如本具的智慧而得大自在。于此,即便采用写意手法、写意风格,却在“写”中有意识地保持了一份定和静,如沧桑粗犷在岁月的风剥雨蚀中散尽火气,心正气和,默契于妙。
三
2022年7月20日上午,我所创作的这尊鉴真像永久立在了东京上野恩赐公园的不忍池畔。像高250cm,黄铜铸就。中国驻日本大使孔铉佑、东京都知事小池百合子女士、日本外务大臣政务官三宅伸吾等中日嘉宾共同为塑像揭幕。
上野公园始建于1873年,是东京的第一座公园。园中湖光山色,随处可见苍松翠柏,江户和明治时代的建筑古迹散落其间。除灵秀的风景外,上野公园之美,更在于厚重的历史人文积淀。东京国立博物馆、国立科学博物馆、东京都美术馆、国立西洋美术馆、东京文化会、上野之森美术馆等最重要的文化艺术场所皆云集于此。在这里,可以看到古今并置,体会历史文化的变迁,享受人间闲逸的美好。待到樱花烂漫时节,鉴真大师的道影将在公园中片片“绯红的轻云”映衬下,向世人讲述中日两国的千载友谊传承。
虽于日本传法十年,鉴真大师却从未亲眼见过日本风景。这一次,他走出寺院禅堂,观照着眼前的无边风月与人伦万象。诚然,在大师的法眼中,滔滔浊浪,禅心云水,本非二相,空色一如。而即便洞明世相因缘,他亦始终对众生抱有深情,对万物心怀悲悯,坚定地引领其同升佛国——恰如“不忍池”之名的殊胜。
不忍池,其名称由来众说纷纭,不一而足。但在东方文化中,不忍二字别有深意。当年,佛陀证道后,正是因不忍众生沉沦,不忍众生受苦,不忍众生无明,不忍放弃才住世传法。当年,鉴真大师心怀不忍,才排除万难,鲸涛千里传梵典,不仅点燃了如来教法的明灯,也点燃了自心的明灯,更点燃了此岸、彼岸、今生、后世无数人的心灵之灯。不忍,即菩提,即仁心,即良知。
七月,正值莲花盛开。不忍池中碧波潋滟,荷叶田田,无数莲花接天映日,香远益清,亭亭净植。莲花是佛教圣物,乃“污”和“净”的统一,喻示出世与入世的并行。在生命怒放的季节,鉴真像立于池畔,背倚莲花净土,面对滚滚红尘。此幕场景,可谓机缘偶合,亦为随缘应化,不正是鉴真大师不耽禅悦清净,以舍我其谁的大无畏勇气跃入尘世而利益众生的象征吗?瞻仰其自若的丰姿,感受其如缕的气息,世人仿佛听闻经诵梵呗、晨钟暮鼓依稀传来,不禁于畋猎恣情的尘寰喧嚣中放缓心驰的脚步。
青山一道同云雨,明月何曾是两乡。中国和日本人民曾以信念和智慧架起友谊的桥梁。今天,鉴真大师再次东渡,依然能够隔海相望欣同风。这位两国千年缘分的见证者,沐浴着时代之清风,撒播着和平之新绿,必将再次唤醒性灵淤塞者。
《光明日报》( 2022年12月23日 16版)
(文图:赵筱尘 巫邓炎)