自有记录以来,巨大数据缺口占据人类历史大部分。从“作为狩猎者人类”(MantheHunter)理论开始,编年史家几乎没有为女性在人类演化中扮演角色留下什空间,无论是文化还是生物学意义上演化。相反,男性生活被用来代表全体人类生活。而在谈及另半人类生活时,通常只剩沉默。
这种沉默无处不在,遍布们整个文化:电影、新闻、文学、科学、城市规划、经济学。们向自己讲述那些关于过去、现在和未来故事,全都扭曲,被打上女性“缺席”标记。这就是性别数据缺口。
性别数据缺口不仅仅关乎沉默。这些沉默、这些缺口,皆有其后果。它们每天都在影响女性生活。这种影响可以相对较小。例如,女性在办公室里瑟瑟发抖,因为空调温度是按男性体温标准设定;或者伸手够货架顶端十分费劲,因为货架是按男性身高标准设计。让人恼火吗?当然。是不是不公平?毫无疑问。
但这些事还不会危及生命。除非你出车祸,而汽车安全措施在设计时又恰巧没有考虑到女性身材;或是你心脏病未能确诊,因为症状被视为“非典型”。对这些女性来说,生活在个以男性数据为基础世界里,后果可能是致命。
论及性别数据缺口,最重要观点之是它通常不带恶意,甚至并非有意。事实恰恰相反:性别数据缺口完全是种存在数千年思考方式产物,因此也可说源于不思考。双重不思考:男人不言而喻,女人不被提及。因为当们说到人类,总来说,们指是男人。
这不是什新发现。西蒙娜·德·波伏瓦在1949年写下著名论断:“人类是男性,男人不是从女人本身,而是从相对男人而言来界定女人,女人不被看作个自主存在。(……)男人是主体,是绝对,而女人是他者。”[1]要说什是新,那就是女性继续作为“他者”存在环境,而这环境即们所处世界越来越依赖和受制于数据。尤其是大数据。反过来,大数据又在大计算机里接受大算法筛选,以便筛出大真理。但当你大数据被巨大沉默所破坏,你得到真相就只是半真半假。而且通常对于女性来说,它们根本就不是真。正如计算机科学家自己说:“垃圾进,垃圾出。”
这种新环境令消除性别数据缺口需求更加迫切。辅助医学诊断、筛选简历甚至面试潜在求职者人工智能已经很常见。但是训练人工智能数据集充满数据缺口——而且由于算法通常被当作私有软件且受到保护,们甚至不能检查这些缺口是否被考虑在内。不过,从现有证据来看,显然是没有。
对这本《看不见女性》来说,数字、技术、算法都至关重要。但它们只讲述故事半。数据只是信息另种说法,而信息有很多来源。没错,统计是种信息,但人类经验也是信息。所以认为,当们设计个为所有人服务世界时,们需要女性在场。如果那些对们所有人产生影响决定,都是出自身体健全白人男性(九成来自美国),那也会形成数据缺口——就像在医学研究中不收集女性身体信息会形成
请关闭浏览器阅读模式后查看本章节,否则可能部分章节内容会丢失。