报告厅不大,能坐一百多人,今天来了七八十个。尚育三世站在讲台上,穿着一件深灰色的西装,领带系得很紧,头发梳得整整齐齐。他二十二岁了,脸很瘦,颧骨很高,眼窝很深,但眼睛很亮。他面前放着一台笔记本电脑,屏幕上是琉球语AI助手的演示界面。他的手放在翻页器上,手指微微蜷着。台下坐着教授、评委、同学,有人低头看手机,有人翻着论文,有人抬头看着他。他深吸了一口气,按了一下翻页器。
屏幕上的幻灯片翻了一页,标题是“琉球语AI助手:濒危语言的数字化保护”。他开口了,声音不大,但很清楚。
“琉球语,是琉球群岛原住民族的语言。目前,能流利使用琉球语的母语者,估计不到十万人,且大多数在六十岁以上。琉球语被联合国教科文组织列为‘濒危语言’。我的项目,是用人工智能技术,为琉球语的保护和传承提供一个工具。”
他按了一下翻页器,屏幕上的幻灯片切换到AI助手的界面。他在对话框里打了一行字——“はいさい。”按下了回车。AI助手回复了——“はいさい。うちなーんちゅ やいびーん。何をお手伝いしましょうか?”(你好,我是琉球人。请问需要什么帮助?)
台下有人发出了轻微的惊叹声。他继续打字——“くわっちーさびら。私の名前は尚育です。”AI回复——“尚育さん、くわっちーさびら。にふぇーでーびる。”
对话很流畅,AI的语气很自然,像是在跟真人聊天。他又打了几句话,AI一一回答。台下的同学开始交头接耳,有人举起了手。
教授坐在第一排,五十多岁,头发花白,戴着一副黑框眼镜,手里拿着一支笔。他是东京大学人工智能研究所的教授,姓山本,专攻自然语言处理。他看着屏幕,眼睛一眨不眨。
“这个AI的对话数据,是从哪里来的?”
尚育三世按了一下翻页器,屏幕上显示出数据来源的图表。
“主要来自两个来源。第一,是《琉球语词典》,八千多个词汇,每个词都有发音、释义和例句。第二,是《琉球旧记》,一部用琉球语写成的历史文献,里面包含大量的琉球语句子。我把这两本书数字化,作为训练数据。”
山本教授点了点头。
“准确率呢?”
尚育三世翻到下一页。
“目前琉球语AI助手的对话准确率约为百分之八十五。对于常用词汇和句型,准确率可以达到百分之九十五以上。对于生僻词汇,准确率会下降。但我们的模型会不断学习,随着使用量的增加,准确率会逐步提升。”
山本教授放下笔,摘下眼镜,擦了擦镜片。
“这个项目不仅有技术价值,更有文化意义。琉球语是濒危语言,你的工作对语言保护做出了贡献。我看了你的论文,数据准备很扎实,模型设计也很合理。你是用什么框架训练的?”
尚育三世翻到技术架构那一页。
“用的是Transformer架构,基于开源模型微调。训练数据经过清洗和标注,数据量不大,但质量很高。我还加入了发音特征,让AI的发音更接近母语者。”
山本教授又点了点头。他站起来,走到讲台前,看着屏幕上的AI助手界面。他打字问了一句话——“你是谁?”AI回答——“我是琉球语助手,很高兴为您服务。”山本教授笑了,拍了拍尚育的肩膀。
“不错。毕业后,来我的实验室继续研究吧。”
尚育三世看着他,看了一会儿。
“谢谢教授。”
台下响起了掌声。同学纷纷举手提问。有人问“数据标注是怎么做的”,有人问“模型部署在什么平台”,有人问“未来计划增加什么功能”。尚育三世一一回答,不急不慢。他的手不抖了,心也不跳了。站在台上,他觉得自己不是一个人。曾曾曾祖父站在他身后,祖父站在他身后,父亲站在他身后。他们都在。
提问环节结束。报告会也结束了。同学们陆续离开,有人走过来跟他握手,有人加了微信,有人只是笑了笑,走了。尚育三世收拾好笔记本电脑,装进包里,准备离开。山本教授走过来,手里拿着那份论文。
“尚育君,你的论文里提到,这个项目的灵感来自你的家族?”
尚育三世看着教授,看了一会儿。
“是。我的曾曾曾祖父叫尚泰。他是琉球的最后一位国王。他写了一本书,叫《琉球旧记》,用左手写的,写到手废了。我的曾祖父编了《琉球语词典》,用了五年。我的父亲做了琉球旧记网站和VR博物馆。我做这个AI,是想把他们的工作延续下去。”
山本教授沉默了片刻。
“你来自一个了不起的家族。”
尚育三世摇了摇头。
“不是了不起。是不想忘。”
“毕业后来我的实验室。我们一起,让这个AI更好。”
尚育三世点了点头。
“谢谢教授。”
他走出报告厅,阳光照在他身上,暖洋洋的。他抬起头,看着天空。天很蓝,几朵白云慢悠悠地往南飘。他看着那些云,想起了曾曾曾祖父。曾曾曾祖父在东京的书房里,用左手握着笔,一笔一划地写。写了十几年,写到手指伸不直,写到腿废了。他写的时候,不知道会不会有人看,不知道会不会有人懂,不知道会不会有人记住。但他写了。现在,他的曾曾曾孙站在大学的讲台上,向教授和同学们展示用他的书做的AI。他一定会高兴的。
他走在校园的路上,路很长,两边是银杏树,叶子绿油油的,在风中摇晃。他走得很慢,不急。他想起刚才教授说的话——“你来自一个了不起的家族。”他摇了摇头。不是了不起。是不想忘。不想忘就不会丢。
回到宅邸,父亲坐在廊下,看着那棵枇杷树。他五十一岁了,头发白了大半,脸上的皱纹很深,但眼睛还是很亮。他转过头,看着儿子。
“报告会怎么样?”
尚育三世在父亲身边坐下来,从包里拿出笔记本电脑,打开,点开AI助手的界面。
“教授说,毕业后去他的实验室。继续研究琉球语AI。”
尚泰四世看着屏幕,看着那个蓝色的对话框。他伸出手,在键盘上打了两个字——“你好。”AI回答——“はいさい。尚育さんのお父様ですか?はじめまして。”(你好。您是尚育的父亲吗?初次见面。)他笑了。那个笑容很浅,嘴角往上翘了一下就收回来了,但他的眼睛亮了一下,像是里面有什么东西在烧。
“它知道我是你父亲。”
尚育三世笑了。
“我告诉它的。”
尚泰四世点了点头。他把笔记本电脑合上,放在旁边。
“你曾曾曾祖父会为你骄傲的。”
尚育三世的眼泪流了下来。不是哭,是流泪。他没有擦,让眼泪流着。
“爸爸,曾曾曾祖父会不会觉得,我做的跟他做的不一样?”
尚泰四世看着儿子,看了一会儿。
“工具不一样,时代不一样。但心是一样的。你曾曾曾祖父写书,是为了让人记住。你做AI,也是为了让人记住。一样的。”
尚育三世低下头,看着自己的手。他的手很年轻,手指很长,关节不明显,指甲剪得很整齐。他想起曾曾曾祖父的手,那只手变形了,手指蜷着伸不直。曾曾曾祖父用那只手写了一本书。他用这只手做了一个AI。两只手不一样,但握着的东西是一样的。
夜幕降临,月亮从东边升起来了,挂在枇杷树梢头,又大又圆。月光照在院子里,白花花的,像铺了一层霜。尚育三世坐在书房里,打开AI助手的后台,看到使用量已经突破了五百万。他截图,发给了父亲。父亲回了一条消息——“好。”
他笑了。他铺开一张白纸,提起笔,蘸了墨。他要写,写今天的事。写他在报告会上演示了AI,教授说“了不起”。写教授邀请他去实验室。写父亲说“一样的”。写下来就不会忘,不会忘就不会丢。他低下头,开始写。笔尖在纸上移动着,沙沙沙的。他写得很慢,但不停。不能停。停了就接不上了。接不上了就会断,断了就再也接不回来了。
窗外,风吹过来,吹动了枇杷树的叶子,沙沙沙的。他听着那个声音,继续写。不抬头,不停笔。写到写不动为止。写不动了还有别人。别人写不动了还有别人。不会断。断不了。
