数据科学家凯西•奥尼尔认为,我们应该警惕不断渗透和深入我们生活的数学模型——它们的存在,很有可能威胁到我们的社会结构。
我们生活在一个依赖“算法”的时代,它对我们生活的影响越来越大,我们去哪里上学,我是不是应该贷款买车,我们应该花多少钱来买健康保险,这些都不是由人来决定的,而是由大数据模型来决定的。从理论上来说,这一模型应该让社会更加公平,每一个人的衡量标准都是一样的,偏见是不存在的。
但是,正如凯西•奥尼尔书里所揭示的那样,事实并非如此。我们今天所使用的这些数学模型是不透明的、未经调节的、极富争议的,有的甚至还是错误的。最糟糕的是,数学模型和大数据算法加剧了偏见与不公。例如,一个贫困学生想申请贷款交付学费,但是银行大数据算法根据他居住地的邮政编码判断将钱带给他存在风险,因此,拒绝给他提供贷款。他因此失去了受教育的机会,而这个机会可能帮助他摆脱贫困。大数据算法做的常常只是锦上添花的事儿,有时甚至是落井下石。
通过个案追踪,凯西•奥尼尔揭示了大数据是如何影响我们将来的,它不仅影响着个人,也影响着整个社会。这些数据评价着我们的老师、学生,筛选着我们的简历,审核着我们的贷款资格,衡量着员工的工作态度,监视着投票者,监控着我们的健康。
凯西•奥尼尔呼吁数据模型的创造者们要对算法负责,政策的制定者及执行者们在使用这一威力极大的“武器”前应该更加慎重。最后,作者指出,大数据几乎掌控着我们的生活,我们应该增加对它的了解。这本书相当的重要,它让我们有能力去问一些十分尖锐的问题,帮助我们了解事实的真相,提出需要改变的地方,探索更好的生活。
【编辑推荐】
案例丰富,内容兼具深度与话题性
未来20年,算法和大数据将席卷世界,接管我们的生活、社会和经济。我们生活中的很多方面都将落入自动化的数据分析之下。确保算法和大数据的公平性将是一项重大的任务,数据伦理的价值和意义将不断凸显出来。在作者看来,大数据犹如一个黑盒,规模、伤害和隐秘共存,她在书中引用了大量发生在美国当下的、基于大数据和算法的、改变个人生活的案例,并对影响这些城市生活经验的算法做了特别的观察和研究。作者认为,数据和算法的关系就像枪械和军火,数据没有价值观,是中立的,但来自人类行为的输入,难免隐含偏向,而算法创造的数据又对人类行为产生反作用,从而导致更多的不公。凯西在书中指出:算法模型一旦运转,执法行为就会增多,产生的新数据又会进一步证明加强执法的必要性。形象地说,就是哪里“前科”越多,哪里就越受算法“关照”,最终形成一个失真,甚至有害的回馈环路。这个观点也正是近来Facebook干预美国大选,国内很多专家学者热议“今日头条”推送模式的核心所在。
权威作者的深刻洞见
本书作者是哈佛大学的数学博士,研究方向是数论和代数几何,毕业之后在麻省理工学院执教,并在互联网公司做过很长时间的数据科学家,如今致力于教育和媒体行业的数据知识普及工作,因此,这并不是一本传统意义上唱衰大数据的书,相反,作者希望让更多的人通过了解大数据、了解算法,反思模型,以及通过政府和相关机构的合理监管,不断改善各类设计评价体系,让更多的人受益,维护社会的公平与民主。
【英文版获奖情况】
《纽约时报》(New York Times)年度书籍
《波士顿环球报》年度最佳图书
《连线》杂志年度必读书目之一
《财富》年度最受欢迎的书之一
《柯克斯评论》年度最佳作品
芝加哥公共图书馆年度最佳图书
《自然》网站年度最佳图书
《麻省理工科技评论》年度最佳科技图书
凯西•奥尼尔(Cathy O'Neil)
数据科学家,mathbabe.org的博主。博士毕业于哈佛大学,主修数学专业。她曾在巴纳德学院任教,之后为私营企业服务,例如避险基金。她还在各类新型公司担任数据科学家,预测消费者购买与点击趋势。每周她都会出现在“财富记账”的播客上。
出于提升排名名次的需要,各个大学就像管理投资组合一样管理着自己的学生。这在大数据领域里很常见,小到广告业大到政治领域都是如此。在校领导看来,每一个准大学生都代表着一组资产和一两项债务。比如,一名高中生在体育赛事上的优秀表现就被视为一种资产,但同时她的成绩可能处于中下游水平,后者就是她背负的债务。她可能还需要申请助学金,这又是一项债务。为了平衡投资组合,他们应该发掘其他能自费上学并且成绩优秀的考生。但是那些理想考生即使被录取了也可能会选择去其他更好的学校。这也是一个必须要量化的风险。鉴于整个评估体系非常复杂,为了“优化招生”,教育咨询产业兴起了。教育咨询公司诺埃尔–莱维茨(Noel-Levitz)开发了一个被称为“预告+”(ForecastPlus)的预测性分析软件包。该软件包允许招生老师根据地理位置、性别、种族、研究领域、学术地位及“任何其他特征”对准大学生的情况进行评估。另一个名叫“定位学生”(RightStudent)的咨询机构则致力于收集、买卖相关数据以帮助大学客户找到最适合录取的学生人选,包括可以支付全额学费的学生,以及可能有资格获得校外奖学金的学生。就这个意义而言,学习障碍对于大学录取可能反而是个优势。……教育公司的专业人士了解每个学校的招生模型,所以他们知道怎样让一个准大学生被纳入其目标学校的“投资组合”之中。一位加州的企业家在教育产业把市场分析法发挥到了极致。他叫马振翼,是美国星腾科国际教育集团的创始人。他用自己开发的模型评估准大学生,计算他们被目标院校录取的可能性。他对《彭博商业周刊》的记者表示,假设一个美国高中生的平均学分绩点(GPA)为3.8,SAT成绩为2000分,课外活动时间为800小时,那么他被纽约大学录取的概率为20.4%,被南加州大学录取的概率为28.1%。然后,星腾科将提供一份有担保的建议组合。如果这个学生接受了咨询公司的建议辅导并...
——引自章节:排名模型的焦虑和杀伤性的对立面
在研究数学杀伤性武器的时候,我们常常需要在公平和效率之间进行权衡。我们的法律传统更倾向于公平。例如,宪法就假定一个人是清白的。站在建模者的立场,无罪推定是一个约束条件,其带来的副作用让一些确实有罪的人被判无罪释放,特别是那些能够请得起优秀律师的人。即使是那些被判有罪的人也有权对判决提出上诉,而这又会消耗大量的时间和资源。因此,我们的法律体系在很大程度上牺牲了效率来保证公平。宪法的隐含判断是,相比监禁或处决一个无辜的人,因缺乏证据释放一个很可能犯了罪的人对我们的社会造成的危害更小。相反,数学杀伤性武器更倾向于效率。本质上,数学杀伤性武器建基于可测量和可计算的数据。但公平是模糊的,很难量化,它是一个抽象概念。我们的计算机程序尽管在语言学习和逻辑学习方面有所进步,但仍然不能很好地理解抽象概念。它们所理解的“美”只是一个与大峡谷、海洋日落和时尚杂志的美容美发相关联的词,它们试图通过计算脸书上的点赞数和关系网来衡量“友谊'”。而到目前为止,计算机还完全不理解公平这个概念。程序员不知道该如何为公平编码,他们的老板也很少会要求他的做这件事。
——引自第103页
RepresentativeofthequalityofthefourteenthandfifteenthcenturyItalianpaintingsinth...
日本宝库社,位于日本东京腹地的一家历史悠久、全球知名手工产业公司,日本“手艺协会”的创始人,旗下拥有众多海内外著名的手工作者和资深的手工培训教师,一个庞大的一流...
彼得·伯克(Peter Burke),英国历史学家,当代著名新文化史家。曾执教苏塞克斯大学、剑桥大学,现为剑桥大学文化史荣休教授及伊曼纽学院(Emmanuel ...
InConnectionwithTheDeWilloughbyClaimCHAPTERIHIGHnoonatTalbotsCross-roads,withthe...
序陈冠中这里是2000年后我在北京写的部份文章。那时开始我跟国内文化、知识界的朋友连续而紧密的接触,随后若干年来我都在一面补课,追溯、辨识同代大陆读书人的知识宗...
作品目录自序动乱时代中国学术界的大损失――悼闻一多先生回来杂记文学的标准与尺度论严肃论通俗化论标语口号论气节论吃饭什么是
功能纤维及功能纺织品 目录 **章总论**节纺织纤维概论一、纺织纤维的分类二、纺织纤维的发展历史第二节功能纤维及功能纺织品分类一、防护性功能纤维及纺织品二、保健...
落落,82年4月生,上海人,编辑,自由撰稿人。作品有长篇小说《年华是无效信》(2005年),短篇小说集《那些生命中温暖而美好的事情》(2005年),长篇小说《尘...
黄喆,1975年生于上海,上海科技大学本科毕业,后获上海交通大学-法国马赛商学院MBA学位。曾先后就职于百事可乐、高露洁、欧莱雅等知名外企。大学期间曾独自一人去...
前世,春荼蘼是一個精明強幹的律師,為了成功,不擇手段、傷天害理的事沒少做,或許是天理昭彰,報應不爽!一場車禍,春荼蘼重生在千年前的異時空大唐,出身軍戶之家,雖不...
《优秀的人,都敢 对自己下狠手》,写给在大城市打拼的你。如果你想从小城市到大城市工作,如果你即将毕业不知道自己将来到底干什么,如果你正处在职场转型期,如果你想去...
作为西方思想史上不能绕过的哲学家,托马斯•霍布斯以他的机械唯物主义、“自然状态”和国家起源说著称,1651年出版的《利维坦》一书,被誉为西方政治哲学奠基之作。然...
编辑推荐1.金融领域趋势。过去几十年,金融业一直过于依赖简单的统计技术来识别数据中的模式,机器学习算法有望改变这一现状。在未来几年,机器学习将引领金融界,给金融...
Hereisastorywithaboyhero,andaboyofwhomyouhaveneverbeforeheard.Therearegirlsinthe...
1985年,马克·夏加尔,蓝色海岸边继马蒂斯和毕加索之后最后一位德高望重的“族长”,在圣保罗·戴·旺斯市与世长辞,享年九十八岁。马黎画派为能接纳众多的外国艺术家...
台灣的著名作家──三毛1943年3月26日出生於重慶,浙江省定海縣人。本名為陳懋平,1946年改名陳平。筆名『三毛』更不知出自何處,只在她的《鬧學記》一篇序文中...
皮肤病必效单方精萃 内容简介 本书内容是以皮肤科诸病为纲,分列十一病系,精选出了2000余首临床验之有效、方便实用的皮肤病单方。本书对每一疾病的病名、临床特点,...
★我们在别人的愿望里长大, 在自己的愿望里出发★韩国版萨利·鲁尼,“黑马作家”白温柔首部作品★荣获韩国创批青少年文学奖、今日作家奖★本书在韩国两年,销量突破70...
韩泰熙,1962年出生于首尔。毕业于首尔艺术专门大学应用美术系,之后一直从事儿童绘本的绘画创作至今。1998年举办了首次个人展《走进童话的旅行》,自写自画的作品...
精彩摘录严格的“科学”方法难以在科学的假设与其外部的信仰体系间保持平衡。它们允许宗教研究,但通常将它当作心理现象或社会现