历史
独步逍遥 > 看不见的女性 > 第8章 适合所有人的尺寸

第8章 适合所有人的尺寸(4 / 7)

同样很严重。2016年篇论文随机抽选出100条急诊主治医生口述医嘱,都是通过语音识别软件识别,结果发现其中有15%错误非常严重,“可能会导致沟通错误,从而影响对病人治疗护理”。[23]遗憾是,作者并没有将他们数据按性别分类,但有相关文献报道说,女性语音转录错误率明显高于男性。[24]赛义德·阿里博士是其中项医学听写研究主要作者,他观察到其研究“直接影响”是,女性“可能要比男性多费点力气,才能成功使用(语音识别)系统”。[25]蕾切尔·塔特曼表示认同:“男性在使用这些技术时效果更好,这意味着女性更难做好自己工作。即使改正个错误只需要秒钟,但这些时间日积月累下来就不再是个小数字,相比之下,你男同事不会将这些时间浪费在跟技术折腾上。”

汽车导航系统供应商ATX语音技术副总裁汤姆·沙尔克提出种新颖方案来解决“女性语音诸多问题”,世界各地受挫女士看来得为此击节相庆。[26]他说,女性需要是“长期培训”——只要女人们“愿意”接受培训就行。沙尔克感叹道,但她们根本不想。就像在孟加拉国那些固执己见、总是买错炉子女人样,买车女人也总是不合理地期望软件开发人员设计出款适合她们语音识别产品,但很明显,需要解决问题是女人自己。为什女人不能更像男人呢?

蕾切尔·塔特曼驳斥这种认为问题在于女性声音而不在于技术无法识别女性声音说法:研究发现,女性具有“明显更高语音可辨度”,[27]这可能是因为女性发出元音往往较长,[28]语速比男性稍慢。[29]与此同时,男性“说话不流畅概率更高,使用单词持续时间略短,而且使用替代(‘含混’)发音更多”。[30]考虑到所有这些因素,语音识别技术应该更容易识别女性而不是男性声音——事实上,塔特曼写道,她已经“利用女性语音数据对分类器进行训练,而且谢天谢地,效果很好”。

当然,问题不在于女性声音,而在于老朋友——性别数据缺口。语音识别技术是在名为语料库大型语音记录数据库上进行训练。这些语料库主要收录男性声音录音。无论如何,就们所知:大多数语料库中声音素材都未按性别分类,当然,这本身就是个数据缺口。[31]当塔特曼研究语音语料库性别比例时,只有TIMIT(“语言数据联盟中最受欢迎语音语料库”)家提供按性别分类数据。当中69%是男性。但与这些发现所暗示相反,事实上有可能找到女性说话录音:从英国国家语料库(BNC)[32]网站上数据来看,该语料库是性别平衡。[33]

不光是语音语料库会催生偏向男性算法。文本语料库(由小说、报纸文章、法律教科书等各种文本组成)被用来训练翻译软件、简历扫描软件和网络搜索算法,它们数据也充斥着性别数据缺口。搜索英国国家语料库[34](收录20世纪晚期大量文本中1亿个单词),发现女性代词出现率始终只有男性代词

请关闭浏览器阅读模式后查看本章节,否则可能部分章节内容会丢失。

排行阅读

苍白爱情

三秋泓
天之骄子渣攻X自卑怯懦美人伪骨科年下宋知雨寄人篱下,为了苟活,主动变成了继弟严越明最喜欢的床上玩具。注意:没有排雷,到处是雷。自带扫雷系统,谢谢。
这是一个理智与情感的故事。关于梦想,人人夸夸其谈;关于爱情,人人缄默不语。我爱你,更爱我自己。 名校毕业工作能力出众的纪星因为不堪职场骚扰辞职创业,一路挫折不断,却因投资人韩廷的指导和提点而渐渐褪去生涩,变得成熟。 事业开始顺利时,与男友的感情却走到尽头。她与韩廷之间也渐渐产生暧昧,关系发生改变。
我深深地爱着你,你却爱着一个傻逼,傻逼他不爱你,你比傻逼还傻逼,爱着爱着傻逼的你,我比你更傻逼,简单来说,本文讲述一个,谁比谁更傻逼的故事。

秋以为期

桃千岁
军二代攻 X 黑帮老大受,强强,肯定有反攻。《无地自容》系列文。军二代和黑帮老大的强强对决。主角:柯明轩,边以秋。是否互攻,看我心情,反攻是一定有的。

相爱未遂

金陵十四钗
满城衣冠副CP,律师X检察官,破镜重圆本文第一人称,互攻。

万族之劫

老鹰吃小鸡
万族之劫男主角是苏宇,原大夏府南元城南元中等学府学生,以上上等的高评价、并以南元第一的成绩考入大夏文明学府并拜师白枫,加入多神文系,脑海中开启神秘书册。我是这诸天万族的劫!万族之劫小说什么时候更新?
最新小说: 残虐记 妻子的后事 再见,哥伦布 月球 无底牌游戏 亲爱的蜂蜜 万人嫌死后他们都后悔了 就算变成丧尸也要摆烂 卡塞尔不欢迎逻辑 大超的五条猫猫饲养日常