乐动网页版_乐动(中国)


    咨(zī)询热线:021-80392549

    乐动网页版_乐动(中国) QQ在线(xiàn) 乐动网页版_乐动(中国) 企业微(wēi)信
    乐动网页版_乐动(中国)
    乐动网页版_乐动(中国) 资(zī)讯 > 人工智能(néng) > 正文

    107年之后 AI让我们发现(xiàn)泰坦(tǎn)尼克沉没的(de)更多真相

    2019/06/05机器人420

    泰坦尼克号沉没(méi)已经(jīng)过去107年,这(zhè)场(chǎng)悲(bēi)剧(jù)与可持续农业、人口迁移问题或者健康保险费率等现代问题能有什么关系?这里给大(dà)家一(yī)点提示:数据证明。

    无(wú)论是好是坏,现代世界正越来越多地(dì)利用算法识别数据中的(de)模式,并根据这些模式做出预测(cè)。人们希望回(huí)答的问题是,“某个人能否(fǒu)在泰(tài)坦尼克号的沉没中幸存下(xià)来?”而这个问题(tí)的基本分析方法,与“最有可能的人口迁移途径是什么?”完全一致。

    历史悠久的问题

    基于泰坦尼克号数据集,以预测海上(shàng)生存(cún)概率,一直是(shì)众多胸怀抱负的数据科学家以及程序员的(de)标准实践(jiàn)问题(tí)。

    这是一个(gè)基本的挑战(zhàn):将一(yī)部分泰坦尼克号乘客名单添加至(zhì)算法(fǎ),其中描述每(měi)位乘客及其特性的一些(xiē)基(jī)本变量。根据这些数据,算(suàn)法应能够提(tí)出相关结(jié)论,说明哪些变量决定某个人在1912年4月那个寒冷的夜晚拥有(yǒu)更高的生存或者(zhě)死亡机率。为(wéi)了测试结果是否正确(què),你(nǐ)需要利用训(xùn)练完成(chéng)的算法处理名单中(zhōng)的其余乘(chéng)客信息,而后与实(shí)际结(jié)果进行(háng)比(bǐ)较。

    Kaggle.com等在线社区曾(céng)经(jīng)进行过这样的(de)竞赛,看谁能够开发(fā)出准确率最高的生存预测算法。此外,这也是大学课(kè)程(chéng)当中的常(cháng)见问题。乘客名单(dān)大(dà)到足够能反映(yìng)出明确(què)的趋(qū)势,同时又小到能够被初学者(zhě)掌握。其结果也相(xiàng)对简单——决定生(shēng)死的变量可(kě)能(néng)只有十(shí)几项,所(suǒ)以问题并不复(fù)杂,初学者也能够解(jiě)决;但其中(zhōng)的交互关系又(yòu)足(zú)够(gòu)复杂(zá),能吸引到技术(shù)人员的关注。另外,由于(yú)泰坦尼克号的故事非常有名,因此(cǐ)即使过去一个(gè)多世纪,仍能引发共鸣(míng)。

    SparkBeyond公司正在将(jiāng)泰(tài)坦尼克号问题作为其(qí)AI平(píng)台的早期(qī)测(cè)试素材,并希望将其作为向潜在客户展示技术能力的方式之一。该公司(sī)联(lián)合创始人兼CEO Sagie Davidovich表(biǎo)示,“有(yǒu)趣(qù)的是,即(jí)使是在像(xiàng)泰坦尼克号这样简单的问题当中(zhōng),我(wǒ)们仍(réng)能(néng)够发掘出大(dà)量(liàng)有价值的(de)结论。”

    生存结(jié)果(guǒ)可归结为变量(liàng)

    如果大家对泰坦尼(ní)克(kè)号的故事比较熟悉,完(wán)全可以通过(guò)简单的数字计(jì)算对乘客的命运做出合理的猜测。

    其中女性的生存机率几乎达到男性的两(liǎng)倍,儿童的生存(cún)机率(lǜ)则为成人(rén)的1.4倍。一等舱乘客的(de)生存机率为其他乘客的1.9倍。事实证明,中年女性与年轻女性之间,舱位等(děng)级对生存(cún)率(lǜ)的影响最大;而在中年(nián)男(nán)性与年轻(qīng)男性之间,年龄差异则是(shì)决定生(shēng)存率的关键。

    虽然这些结果基本在人们的意料之中,但确(què)实能够做出非常(cháng)准确的预测。除此(cǐ)之外,算(suàn)法也需要考虑到其它(tā)变量对(duì)于生存名单的影响,例(lì)如一个人的父母、孩子(zǐ)或者(zhě)兄弟姐妹(mèi)是否同在船(chuán)上。正(zhèng)因为这些复杂性因素的存在,泰坦尼克号乘客名(míng)单才有长久以来一直(zhí)成为数据科学家们(men)关注的经典问题(tí)。

    事实证明(míng),以不同(tóng)的(de)方式查看数据有(yǒu)时也能(néng)带(dài)来更快捷的分析结果。Davidovich指出,SparkBeyond的AI方案就通过查看船(chuán)票上列出的(de)乘客姓名前(qián)缀,发现了这样(yàng)一条分析“捷径”。

    Davidovich解释道,“从数据当中可以看出,最简单的高生存率预测指标就是,乘客(kè)的名字中不包含“先生”这一表述。这显然涉及(jí)到乘客的性别成分,但深入解读,这种现象实际上包含了上面谈到的(de)全部三种生存指标。”因为“先生”这一前缀(zhuì),能够(gòu)快速(sù)确(què)定最(zuì)有可能在沉船事故中死亡的群(qún)体(tǐ):中产阶级及资产阶(jiē)级成年(nián)男性,这一(yī)群更(gèng)有(yǒu)能(néng)力购买(mǎi)头等舱船票的群体(tǐ),往(wǎng)往(虽(suī)然并非全部)拥有“阁(gé)下(xià)”这类头(tóu)衔,而(ér)年轻的(de)男孩则被称为“少爷”(主(zhǔ)要来自(zì)贵族阶层)或者并无特别(bié)的称谓。

    现代应用

    SparkBeyond公司的AI方案目前已(yǐ)经开始研究监狱(yù)暴力行为的原因、半导体制造质(zhì)量控(kòng)制以及人口迁移模(mó)式等问(wèn)题(tí)。

    Davidovich介(jiè)绍称(chēng),“机器智能可以确定(dìng)的一项基本事实,在于自然(rán)灾害(hài)与人口迁移之(zhī)间的联系。美(měi)国人口迁移的(de)大(dà)幅飙升与飓风哈维有(yǒu)关,这一点在某些(xiē)高(gāo)速公(gōng)路及主要道路上体现得(dé)尤为明(míng)显。”

    当(dāng)然,除了(le)数据模(mó)式(shì)这一共同本质之外,泰坦尼克号数(shù)据集还有着另一大共通的特性——尽管人(rén)们在分析时很容易(yì)迷(mí)失在(zài)具体(tǐ)数据(jù)当中,但这(zhè)些纷(fēn)繁复杂(zá)的数字(zì)与变量背后(hòu)仍是真实人生的反映。

    关键词:




    AI人工智能网声明(míng):

    凡资(zī)讯来源注(zhù)明为其他媒体(tǐ)来源的信(xìn)息,均为(wéi)转载(zǎi)自其他媒体(tǐ),并不代表本网站赞同其(qí)观点,也(yě)不代(dài)表本网站对其真实(shí)性(xìng)负责。您若对该文章内容(róng)有任何疑问或(huò)质疑,请立即与(yǔ)网站(zhàn)(www.bz.xinxiang.zz.pingliang.ww38.viennacitytours.com)联系,本网站将(jiāng)迅速(sù)给您回(huí)应并做处理。


    联系电话:021-31666777   新闻(wén)、技术文章(zhāng)投(tóu)稿QQ:3267146135   投(tóu)稿邮箱:syy@gongboshi.com

    精(jīng)选资讯更多

    相关(guān)资讯(xùn)更多

    热(rè)门搜索

    工(gōng)博士人工智能网
    乐动网页版_乐动(中国)
    扫描二维码关注微信
    扫码反馈

    扫一扫,反馈当前(qián)页面

    咨(zī)询(xún)反馈
    扫码关注

    微信公众号

    返回顶部

    乐动网页版_乐动(中国)

    乐动网页版_乐动(中国)