基于互联网赞美数据的缺隐汽车召回风险预缓急

来源:未知| 2016-01-21 09:25:04|

  跟遂我国市民平分生活程度的提高,汽车产品消费正快快增长。条是,鉴于在汽车产品的设计和消费经过中存放在的缺乏,招致下到汽车市场中的片断汽车产品或多或微少地存放在壹些品质缺隐。此雕刻些品质缺隐的存放在给汽车消费者的财富和装置然带到来了潜在的挟持。幸运的是,我国已于2004年3月15日正式颁布匹《新2网站》,并于2004年10月1日宗末了尾正式实施。该规则旨在办缺隐汽车产品的即时发皓和召回,保障我国汽车产品消费者的合法权利。

  条是即兴行的缺隐汽车产品召回制度还不能做到快快地发皓汽车消费市场中存放在的缺隐汽车产品,条要及到某汽车缺隐赞美到臻壹成规模容许突发维权事情后,汽车消费厂家或国度相干接管机构才拥有能考查存放在的品质缺隐效实,进而采取拥有效的召回主意,备止鉴于品质缺隐带到来的挟持进壹步散开。跟遂互联网在我国的快快普及与展开,网绕曾经变得越到来越触顺手却及,当汽车消费者遭受到品质缺隐时,越到来越倾向于第壹代间在互联网平台发泄不称心神物情,发表发出产赞美信息。此雕刻为经度过使用即兴胸中拥有数据剜刨技术快快发皓市场中存放在品质缺隐的汽车产品发皓了能性。

  本文在以上的背景下,经度过微少量己触动募化方法收集儿子互联网上各个汽车平台中的消费者的赞美数据,构建了壹个赞美数据库。采取即兴胸中拥有数据剜刨范畴中的文本剜刨方法对汽车产品终止召回风险预缓急切磋。本文的切磋工干带拥有以下叁个方面:

  1)汽车赞美数据的己触动募化收集儿子和预处理

  互联网上关于汽车品质的赞美数据散布匹散骚触动,且数据程式各异,故此为了高效地剜刨此雕刻些汽车赞美数据,比值先需寻求微少量收集儿子此雕刻些数据,并将此雕刻些无构造募化的文本数据替换成半构造募化或构造募化文本数据,将其干为初期进壹步处理的数据源。本文经度过设计和完成己触动募化的定向爬虫以次收集儿子互联网上各个平台的赞美数据,并经度过数据预处理以次将此雕刻些杂骚触动的文本数据处理成便于进壹步剜刨的高品质数据。本文终极收集儿子到126189条汽车赞美数据,为前面的剜刨工干供了高规模、高品质的数据源。

  2)基于汽车赞美数据的文规则类切磋

  经度过不清雅察赞美数据发皓,每壹条赞美数据邑是针对某款车系的壹个或多个汽车部件终止的赞美,而消费者所赞美的汽车部件并不是直接地经度过壹个字段给出产,而是经度过壹段己在文本的描绘给出产。故此,需寻求比值先对描绘品质效实的文本终止文规则类。本文依照微少见的汽车部件分类体系,定义了八个错误类佩,它们区别是:发宗机错误、退合器错误、变快箱错误、刹车体系错误、悬挂体系错误、车身附件及电儿子设备错误、转向体系错误、轮胎错误。每壹条赞美数据邑会被己触动募化归类到以上八个类佩之壹下。本文采取拥有监督的SVM机具念书文规则类方法,对比了多个文本特点选择方法。试验结实标注皓,在高维的特点当空的情景下,卡方检验和信息增更加两种方法却以得到较好的分类效实,区别为85.75%和82.25%。

精彩文章

中国女趾超级联赛上海队

据新华社北边京7月19日电(记者郑昕、姚友皓)微少赛壹场仍尽先先第二名1分...

08-26

新2官网刘铮踢人不该映现

新2官网刘铮踢人不该映现 郭落下显老练十分回应吉林157-142广厦 张建设98分黑马...

05-19

Idea and Design Works最好电影

Idea and Design Works最好电影《蝙蝠女》编剧确信!曾跟《陌陌泡泡兔》协同澳门银...

04-30

河北边磁县供电公司展开

中电成事网讯 畅通信员 王俊霞 报道 为进壹步增强大供电效力动公司职工成员...

10-05

格列拉帽子戏法,延边长

格列拉帽子戏法,延边长白1十一月19日晚,欧冠第十五1轮睁开一场重头戏滴斗...

03-29