数据科学家凯西•奥尼尔认为,我们应该警惕不断渗透和深入我们生活的数学模型——它们的存在,很有可能威胁到我们的社会结构。
我们生活在一个依赖“算法”的时代,它对我们生活的影响越来越大,我们去哪里上学,我是不是应该贷款买车,我们应该花多少钱来买健康保险,这些都不是由人来决定的,而是由大数据模型来决定的。从理论上来说,这一模型应该让社会更加公平,每一个人的衡量标准都是一样的,偏见是不存在的。
但是,正如凯西•奥尼尔书里所揭示的那样,事实并非如此。我们今天所使用的这些数学模型是不透明的、未经调节的、极富争议的,有的甚至还是错误的。最糟糕的是,数学模型和大数据算法加剧了偏见与不公。例如,一个贫困学生想申请贷款交付学费,但是银行大数据算法根据他居住地的邮政编码判断将钱带给他存在风险,因此,拒绝给他提供贷款。他因此失去了受教育的机会,而这个机会可能帮助他摆脱贫困。大数据算法做的常常只是锦上添花的事儿,有时甚至是落井下石。
通过个案追踪,凯西•奥尼尔揭示了大数据是如何影响我们将来的,它不仅影响着个人,也影响着整个社会。这些数据评价着我们的老师、学生,筛选着我们的简历,审核着我们的贷款资格,衡量着员工的工作态度,监视着投票者,监控着我们的健康。
凯西•奥尼尔呼吁数据模型的创造者们要对算法负责,政策的制定者及执行者们在使用这一威力极大的“武器”前应该更加慎重。最后,作者指出,大数据几乎掌控着我们的生活,我们应该增加对它的了解。这本书相当的重要,它让我们有能力去问一些十分尖锐的问题,帮助我们了解事实的真相,提出需要改变的地方,探索更好的生活。
【编辑推荐】
案例丰富,内容兼具深度与话题性
未来20年,算法和大数据将席卷世界,接管我们的生活、社会和经济。我们生活中的很多方面都将落入自动化的数据分析之下。确保算法和大数据的公平性将是一项重大的任务,数据伦理的价值和意义将不断凸显出来。在作者看来,大数据犹如一个黑盒,规模、伤害和隐秘共存,她在书中引用了大量发生在美国当下的、基于大数据和算法的、改变个人生活的案例,并对影响这些城市生活经验的算法做了特别的观察和研究。作者认为,数据和算法的关系就像枪械和军火,数据没有价值观,是中立的,但来自人类行为的输入,难免隐含偏向,而算法创造的数据又对人类行为产生反作用,从而导致更多的不公。凯西在书中指出:算法模型一旦运转,执法行为就会增多,产生的新数据又会进一步证明加强执法的必要性。形象地说,就是哪里“前科”越多,哪里就越受算法“关照”,最终形成一个失真,甚至有害的回馈环路。这个观点也正是近来Facebook干预美国大选,国内很多专家学者热议“今日头条”推送模式的核心所在。
权威作者的深刻洞见
本书作者是哈佛大学的数学博士,研究方向是数论和代数几何,毕业之后在麻省理工学院执教,并在互联网公司做过很长时间的数据科学家,如今致力于教育和媒体行业的数据知识普及工作,因此,这并不是一本传统意义上唱衰大数据的书,相反,作者希望让更多的人通过了解大数据、了解算法,反思模型,以及通过政府和相关机构的合理监管,不断改善各类设计评价体系,让更多的人受益,维护社会的公平与民主。
【英文版获奖情况】
《纽约时报》(New York Times)年度书籍
《波士顿环球报》年度最佳图书
《连线》杂志年度必读书目之一
《财富》年度最受欢迎的书之一
《柯克斯评论》年度最佳作品
芝加哥公共图书馆年度最佳图书
《自然》网站年度最佳图书
《麻省理工科技评论》年度最佳科技图书
凯西•奥尼尔(Cathy O'Neil)
数据科学家,mathbabe.org的博主。博士毕业于哈佛大学,主修数学专业。她曾在巴纳德学院任教,之后为私营企业服务,例如避险基金。她还在各类新型公司担任数据科学家,预测消费者购买与点击趋势。每周她都会出现在“财富记账”的播客上。
出于提升排名名次的需要,各个大学就像管理投资组合一样管理着自己的学生。这在大数据领域里很常见,小到广告业大到政治领域都是如此。在校领导看来,每一个准大学生都代表着一组资产和一两项债务。比如,一名高中生在体育赛事上的优秀表现就被视为一种资产,但同时她的成绩可能处于中下游水平,后者就是她背负的债务。她可能还需要申请助学金,这又是一项债务。为了平衡投资组合,他们应该发掘其他能自费上学并且成绩优秀的考生。但是那些理想考生即使被录取了也可能会选择去其他更好的学校。这也是一个必须要量化的风险。鉴于整个评估体系非常复杂,为了“优化招生”,教育咨询产业兴起了。教育咨询公司诺埃尔–莱维茨(Noel-Levitz)开发了一个被称为“预告+”(ForecastPlus)的预测性分析软件包。该软件包允许招生老师根据地理位置、性别、种族、研究领域、学术地位及“任何其他特征”对准大学生的情况进行评估。另一个名叫“定位学生”(RightStudent)的咨询机构则致力于收集、买卖相关数据以帮助大学客户找到最适合录取的学生人选,包括可以支付全额学费的学生,以及可能有资格获得校外奖学金的学生。就这个意义而言,学习障碍对于大学录取可能反而是个优势。……教育公司的专业人士了解每个学校的招生模型,所以他们知道怎样让一个准大学生被纳入其目标学校的“投资组合”之中。一位加州的企业家在教育产业把市场分析法发挥到了极致。他叫马振翼,是美国星腾科国际教育集团的创始人。他用自己开发的模型评估准大学生,计算他们被目标院校录取的可能性。他对《彭博商业周刊》的记者表示,假设一个美国高中生的平均学分绩点(GPA)为3.8,SAT成绩为2000分,课外活动时间为800小时,那么他被纽约大学录取的概率为20.4%,被南加州大学录取的概率为28.1%。然后,星腾科将提供一份有担保的建议组合。如果这个学生接受了咨询公司的建议辅导并...
——引自章节:排名模型的焦虑和杀伤性的对立面
在研究数学杀伤性武器的时候,我们常常需要在公平和效率之间进行权衡。我们的法律传统更倾向于公平。例如,宪法就假定一个人是清白的。站在建模者的立场,无罪推定是一个约束条件,其带来的副作用让一些确实有罪的人被判无罪释放,特别是那些能够请得起优秀律师的人。即使是那些被判有罪的人也有权对判决提出上诉,而这又会消耗大量的时间和资源。因此,我们的法律体系在很大程度上牺牲了效率来保证公平。宪法的隐含判断是,相比监禁或处决一个无辜的人,因缺乏证据释放一个很可能犯了罪的人对我们的社会造成的危害更小。相反,数学杀伤性武器更倾向于效率。本质上,数学杀伤性武器建基于可测量和可计算的数据。但公平是模糊的,很难量化,它是一个抽象概念。我们的计算机程序尽管在语言学习和逻辑学习方面有所进步,但仍然不能很好地理解抽象概念。它们所理解的“美”只是一个与大峡谷、海洋日落和时尚杂志的美容美发相关联的词,它们试图通过计算脸书上的点赞数和关系网来衡量“友谊'”。而到目前为止,计算机还完全不理解公平这个概念。程序员不知道该如何为公平编码,他们的老板也很少会要求他的做这件事。
——引自第103页
全球媒體一致讚譽「當代不可或缺的理性聲音--邁可.桑德爾教授,《正義》之後再次發聲!當每樣東西都能買賣,是否有錢,就有了天壤之別?當生命中各種美好事物都被標上價...
一部融合科普性与趣味性、兼具心理学与哲学意味的医学散文。一位满怀仁心的资深医者对几十年行医生涯的回望与省思。感冒发烧、上呼吸道感染、先天性心脏病、阿尔茨海默病、...
美第奇奖、龚古尔传记奖得主鸿篇巨制60万字讲述法兰西的“光荣与梦想”这是对法国知识分子的一次巡礼,也是对一个紧张、矛盾乃至绝望世纪的穿越。·大革命之后,统治法国...
应俊豪,台湾政治大学历史学博士,现任台湾海洋大学海洋文化研究所专任教授、政治大学人文中心兼任研究员、东吴大学历史系兼任教授。专长为北洋外交史、近现代中外关系史、...
Stephensons fourth solo novel, set primarily in a far-future Shanghai at a time ...
「官兵衛,這是只有你才能解決的詭異事件。」在近乎滴水不漏的的閉鎖城池裡,意外的犯罪就這麼接連發生了……【日本戰國史實的經典時刻】╳【巨大密室中的四起推理解謎】米...
迄今最跌宕起伏的香巴拉作品,国内首部“大小香格里拉”全景游记小说。作者重走洛克经典路线,寻找最后的香格里拉。香巴拉大环线,以康定为起点,全程跨过川、藏、滇三省,...
作者:安德烈·别雷(1880-1934),20世纪俄国象征主义文学中最有影响力的作家之一。 代表作品有长诗《交响曲》等,长篇小说《银鸽》《彼得堡》《莫斯科》等。...
作品目录前言布的手作手作工作室访问记布的手作小物皮的手作手作工作室访问记皮的手作小物纸的手作手作工作室访问记纸的手作小物
《《曾国藩家书》读本》内容简介:曾国藩是清世由文人而入武侯的第一人,虽身处乱世,却中正庄严、克己复礼,严格以理学精神修养自
作品目录水煮篇第1章 快速理解无线通信 21.1 引言 21.2 空中接口和无线信道 21.3 无线通信的困惑 31.3.1 困惑一:基站
《中国米食》是在《中国米食》(繁体字版)的基础上,结合当下之新变化,保留精华,尽力完善而成的。全书的设计分为“米粒篇”和“粿粉篇”两部分,米粒篇以朴素的饭团、粽...
彼得·伯克(Peter Burke),英国历史学家,当代著名新文化史家。曾执教苏塞克斯大学、剑桥大学,现为剑桥大学文化史荣休教授及伊曼纽学院(Emmanuel ...
这碗粥离经叛道,纯良无二。喜欢天马行空,在现实和童话之中畅想。作品:《采红》《绊橙》《却绿》《逢青》《扶蓝》《昏黄》微博:@二犬儿蛋微信公众号:这碗粥
环境生物燃料电池理论技术与应用 本书特色 本书较为系统地介绍了近年来国内外环境污染控制生物燃料电池理论技术与应用的发展状况和*新研究成果,环境生物燃料电池的设计...
山田纯也:平面设计师。2000 年起以自由职业者的身份,以群马县为中心开展活动。在从事广告、商标、图案等各种设计的同时,参与撰写多本设计类相关书籍。柘植Hiro...
朱永先临床治验 本书特色 本书从学术思想和临床经验上总结朱永先教授的学术成就,详述疾病的病因病机、诊断鉴别、治疗原则,阐述其特色点、创新点,*后指出本病的临床辨...
赵声良,敦煌学家,敦煌研究院党委书记、研究员、学术委员会主任委员、北京大学敦煌学研究中心合作主任。西北大学、西北师范大学、兰州大学、澳门科技大学兼职博士生导师。...
秦晖,清华大学历史系教授,主要从事经济-社会史、农民问题、改革与现代化问题研究。主编“农民学丛书”,主要著作有《田园诗与狂想曲:关中模式与前近代社会再认识》、《...
王晋康著名科幻作家,中国民主同盟盟员,中国作家协会会员暨中国科普作协会员,河南省作协会员,高级工程师。1966年高中毕业后度过了三年知青生涯,1978年考入西安...