1.汽车解析包是什么意思啊

2.如何进行汽车数据流分析

3.汽车故障诊断时常用的数据分析方法是什么?

4.车辆运行数据是指什么?车企获取你的数据有什么用?

5.车联网数据分析(一):用户出行行为分析

6.遥感监测汽车不合格是什么意思

7.测量系统分析R&R是什么意思

8.线上车检查有显示吗

大量生产的汽车在汽车材料上总是有一张黄牌,上面写着“汽车能耗标志”。包括车辆型号和基本参数,但最引人注目的不是这些数据,而是车辆的燃料消耗或电力消耗。据说汽车测试燃料消耗是无法实现的高标准,为什么实际燃料消耗会高呢?标志的能耗分为三类:城市工程、综合工程、郊区工程

指在三种类型的道路段测试中获得的汽车能源消耗,但这些测试值实际上只有参考值。以燃料动力汽车为例,实际燃料消耗以综合工程状态的燃料消耗量为基础,“3”似乎是真正的水平,为什么这么说呢?

理想现实

汽车油耗测试场景始终是理想环境,即室内温度调节环境,车辆与电力测试仪安装在同一个平台上,车轮被滚轴压着开始“行驶”。其中关键词首先是“恒温”,在25C(摄氏度)的环境下缩短列车时间。内燃机将增加喷射量,直到冷启动气体和防冻冷却液从低温达到理想工作温度,环境温度高可以缩短浓缩喷射的时间,甚至这辆测试车也不做这样的设置,因此测试燃料消耗将明显降低。

汽车行驶中的阻力不仅有车轮旋转阻力,还有风阻。测试网站用大功率鼓风机模拟风阻力,但风力综合车辆的维修质量分析,这股风对轮子施加的反作用力到底有多大?甚至部分车型对比较低的车辆施加压力,能减少车轮的电力损失吗?这些问题似乎没有正确的答案,但该测试至少有效地增加了进气压力,对发动机没有任何伤害。

NEDC

国内采用的燃料消耗测试模型是NEDC模型,被解释为“欧洲驾驶循环法”。简单地说,四次城市交通模拟,一次高速驾驶模拟,城市区间的模式比较特殊,节奏如下。怠速11秒,4秒加速到15公里/h,行驶8秒后刹车停止21秒。加速加快到32公里/h,持续24秒,匀速行驶,停止21秒。加速到3次50公里/h,匀速行驶8.0秒后立即停车。

一次循环的总经过时间为195秒,总行驶距离为994米。4驱动器循环共780秒,行驶距离3976米,平均每小时18.35公里/h。据说汽车测试燃料消耗是无法实现的高标准,为什么实际燃料消耗会高呢?城市道路情况模拟在拥挤的道路上行走时停止的状态,但过度理想化。信号灯的平均闲置时间比测试闲置速度长,内燃机的闲置燃料消耗量相当高。

缓慢的加速在实际驾驶中不显示。因为在拥挤的道路上,绝大多数车辆更加追求效率,开始加速的动作也更大,瞬间燃料消耗是平均水平的几倍。同时测试时要关掉空调系统和很多电子设备,这也是正常使用汽车时不太容易出现的场景。

重点:测试车辆都是发动机状态好的新车,测试轮的阻力调整合理,新轮胎的抓地力也是理想标准。实际车辆中发动机的工作条件受温度和积碳等因素的影响,轮胎在使用中的磨损会逐渐降低粘着力,路面大部分程度不同的损伤3354实际摩擦系数可能只有测试平台的三分之二左右。轮子的功率损失大的话,要以更快的速度输出更强的动力,达到合理的速度。

因此,测试燃料消耗往往很低,但实际驾驶的燃料消耗平均为“3L/100公里”,夏季使用空调更高,冬季低温导致过度冷却,导致热量消耗更大。

汽车解析包是什么意思啊

汽车健康指数的意义是指汽车各方面指标是否合格的意思 包括性能 车内环境等等

车内环境的好坏已经成为他们购车时重要的参考依据。

中国汽车健康指数管理中心发布了“中国汽车健康指数(C-AHI)”2019年第一批车型测评结果。本批次一共10款车型,涵盖自主品牌(3款)、合资品牌(6款)及一款进口车,囊括燃油车(8款)、纯电动车(1款)和混合动力车(1款)。

据了解,该测评主要围绕三个维度进行测试。

第一个是车内挥发性有机物(VOC),主要检测甲醛、苯、氨气、氡气、总挥发性有机化合物及其他污染物;

第二是车内气味强度(VOL);

最后是车辆电磁辐射(EMR),此结果也是第一次在报告中展示。

根据测评结果,笔者针对消费者最为关心的几个点进行了整理,一起来了解一下吧。

高温下哪些有毒气体会对人体产生危害?

有车的朋友应该都很清楚,刚提到手的新车或多或少都会带有一股刺鼻的“原始味道”,而这时大多车主都会选择在车内搁置一些能够净化空气的物件,来吸收掉这些“有毒气体”。

虽然在使用一段时间后,慢慢发现车内已经没有了刺鼻的味道,似乎这些气体已经完全消失。然而,一到炎热的夏天就会发现,汽车在经过太阳长时间曝晒后,仍然会产生刺鼻的味道,这到底是怎么回事呢?

事实上,无论是用香水来掩盖,还是采用净化器来吸收,都无法将汽车内饰以及座椅等内部材料的原始味道完全祛除。

从这次测试报告中可以看到,高温状态下TVOC(总挥发性有机化合物)散发量普遍高于常温,至少在2倍以上。也就是说汽车在经过高温暴晒之后,很多污染源就会被激发。数据显示在常温下,测试车辆的甲醛危害度还可以接受,但一旦在高温下,甲醛危害指数就会直线上升。

而除了人们常说的“五苯三醛”,测试中也发现部分车内气味可能“有毒”。例如,具有果香味的磷酸三乙酯在高剂量下可能使人产生麻醉现象,具有苦杏仁味的氯苯在低浓度下即可麻醉和抑制中枢神经系统,具有酮样气味的甲基异丁基甲酮在国际癌症研究机构IARC列出的2B类致癌物清单中榜上有名,具有泥土味的环己酮则是3类致癌物。

不过这些气体在本次测评样车的车内检出量很低,但消费者如果发现新车内出现明显的这些气味,还是需要引起警惕。

其实这些物质主要来自于车辆的橡胶、增塑剂以及防老剂等材料,虽然说这些材料在现代汽车产业中是不可或缺的,但对于汽车厂家来说,加快研发有效的、无毒的替代材料是它们当前的义务,也是责任。

不论燃油车、混动车还是电动车,车辆在急加减速状态下,车内的低频磁场辐射均普遍远高于匀速行驶时。

但由于急加减速通常持续时间较短,所以消费者也不必过于担心。

如何进行汽车数据流分析

汽车解析包指的是一种汽车电子系统的软件解析工具包。该工具包通过解析汽车各个系统和控制单元的通讯协议和数据格式,可以让工程师们更加方便地进行汽车诊断和调试操作。汽车解析包具有高度的可扩展性和兼容性,可以适用于多种汽车品牌和型号。

随着汽车电子化程度的不断提高,汽车解析包在汽车维修、保养、故障排除等领域的应用也越来越广泛。通过使用汽车解析包,车主可以更加准确地了解自己车辆的状态和健康程度,从而及时采取修复措施。对于汽车维修厂和维修技术人员来说,汽车解析包也是必不可少的工具之一,可以帮助他们更加高效地完成维修任务。

随着汽车技术的不断进步和智能化程度的提高,汽车解析包也将发展出更加精准、智能的功能。未来的汽车解析包将不仅可以对传感器数据进行解析,还可以对车内、车外的多种信息进行分析和诊断。此外,随着汽车网络的不断发展和普及,汽车解析包也将不断拓展其应用范围,进一步满足汽车维修、保养等领域的需求。

汽车故障诊断时常用的数据分析方法是什么?

看了很多朋友的留言,一直在问如何看数据流,如何根据数据流修复故障。根据大家的留言要求,我先简单介绍一下数据流的基本概念和名词解释,然后逐一介绍各个传感器和执行器的详细内容、检查和维护。常见的数据流分析方法

1.数值分析方法

是指分析采集数据的变化规律和范围,或者与标准数据进行比较,以确定数据是否有问题。如电压信号、速度信号、温度信号等。

2.时间分析方法

指通过观察数据是否随时间变化来分析所采集数据流的数值。如冷却液温度传感器、氧传感器的变化频率等。

3.因果分析方法

是指对具有因果关系的数据之间的响应情况和响应速度进行比较和判断。例如,压缩机的运行不是由交流开关直接控制的,而是由电子控制单元在决定是否让压缩机工作之前判断各种信号。

4.相关分析方法

指对彼此相关的数据进行分析比较,然后检查故障是否存在。例如,将电子加速踏板的位置信号与节气门位置传感器的打开信号进行比较。

5.比较分析法

是指在相同的条件下,将同一车型年、同一品牌车型、同一系统的两款车的数据进行对比,以确定是否正常。如果某个值不确定,就和另一辆车比较。

也可以在同一辆车内不同工况下进行对比,比如冷车和热车的数据。

PS:这种方法也可以在更换非同车零件后,通过数值对比来判断故障。

@2019

车辆运行数据是指什么?车企获取你的数据有什么用?

为了消除故障,除了已经学习的检查方法之外,还需要一种识别故障位置的方法。排除故障时,需要结合几次检查和推测来找出原因。

复制方法。

诊断检查。

?电子控制单元数据检查。

。发动机旋转阻力检查。检查发动机的起动情况。点火和预热系统的检查。

燃油系统检查。检查压缩系统。

气缸破损检查。空检查燃油比。

检查活塞环/气门导管的漏油损失。

排气状况检查。

检查端子接触压力。2.复制方法

技术人员应根据产生客户指出的症状的条件,使用一种方法重现故障。根据症状的情况,应结合几种方法进行重现。

施加振动

加热和/或冷却

淋水

施加电力负载

指出

在这个过程中,如果关节无意中断开或连接,接触情况会发生变化,症状可能不会再次出现。在症状通过再现得到确认之前,不要尝试断开和连接连接器。在症状得到确认且技术人员可以进行故障诊断之前,不应断开和连接接头。

如果当技术人员振动线路或加热或冷却部件时症状再次出现,可以确定原因。在这种情况下,执行再现喊侍方法,并且测量电压以确定故障是否在指定电压下发生,从而确定故障位置。

施加振动

模拟车辆振动时发动机倾斜或电线被拉动的情况,振动传感器和电线以再现故障,包括接触不良。

检验方法:

组件和传感器。用手指轻敲部件和传感器,检查是否出现故障。

注意:就继电器而言,当有强烈冲击时,触点会断开。因此,即使它们是正常的,也可能发生故障。

电线和连接器。轻轻地上下或左右摆动线束,检查故障。尤其是电气线路,主要检查接头根部、振动支撑点和车身贯穿部分。

注意:如果连接器中的端子断开,不小心推动电线会连接端子,因此故障无法再现。

发动机振动。当发动机因反向扭矩而倾斜时,发动机舱接线可能会出现故障。在A/

在车辆中,发动机在D或R范围内失速会再现症状。

加热或冷却

由于温度变化导致零件膨胀或收缩,加热或冷却零件造成接触不良或短路的情况。检查方法:使用吹风机、小型空调节器、冰箱等。加热或冷却部件,检查是否有任何故障。

注意:

加热到技术人员仍然可以用手触摸的温度。

[大约60摄氏度或更低]。不要打开电子控制单元等的盖子直接加热或冷却电子元件。

淋水

导致接缝处进水或水汽凝结,向车辆洒水重现故障,包括接触不良或短路。

检查方法:在车辆上洒水,检查是否有故障。注意:

不要将水直接喷入发动机舱,而是将水喷入散热器前部,间接将水蒸气加入车辆。

不要将水直接洒在电子元件上。

指出

如果雨水漏入发动机舱,水可能会通过线路进入电子控制单元或连接器。因此,应该检查这种情况,尤其是如果车辆有漏水的历史。

施加电力负载

导致电池电压下降或波动的情况,并且增加了大的电气负载来再现故障,包括电压下降或波动。

检查方法:打开所有电气设备,包括暖风、前照灯和后窗除雾器,检查是否有故障。

3.诊断检查

概述:为了有效排除故障,使用诊断代码来识别故障位置。以下是通过识别诊断代码进行的判断。

当显示故障诊断码时:故障代码指示的系统中的传感器、执行器、线路和电子控制单元可能有故障。

当显示正常故障诊断码时:具有诊断功能的系统可以判断为正常。因此,故障可能在没有诊断功能的系统中,所以进行这种检查。没有诊断功能的系统包括点火子系统、燃油系统等。

当未显示故障诊断码时:电子控制单元或电子控制单元的电源系统有故障。

检查模式:在正常模式下,如果故障只出现很短的时间,则无法检测到,因为它不符合诊断条件。通过切换到检查模式,可以检测到短期故障,如接触不良。

检查目的:

检查识别的诊断代码是否与实际故障症状一致。代码指示的故障系统可能与实际显示故障的系统不匹配。

检查方法:

检查诊断代码和定格数据并记录下来。

根据诊断问题清除诊断代码并再现故障症状。

要确定车辆进入时郑槐吵的显示代码是由当前故障还是过去故障引起的,请清除显示代码一次,然后执行再现测试。

再次识别诊断代码,并确定该代码是否与故障有关。标准:

如果显示相同的代码,则可以判断该代码指示明念的系统发生了故障。

如果显示与故障无关的代码,或显示正常代码,则当前故障是由其他原因引起的。因此,应进行适合故障症状的故障排除。

车联网数据分析(一):用户出行行为分析

如果有人问你:你介意汽车厂家获取你的车辆运行数据吗?你可能会瞬间有点懵圈:什么是车辆运行数据?它们在哪里?有什么用?汽车厂家如何获取我的车辆运行数据?它们要这些数据做什么......

回答这些问题之前,先来给大家说一个小故事。

我的一个朋友,贷款买了一台挖掘机,每月还款上万元,也是压力山大。刚开始活挺多的,干得不亦乐乎。突然有一天厂家打来电话,说你的车到保养周期了,赶紧做保养。朋友感到特别奇怪:厂家是怎么知道我的车该保养了呢?难道是猜的吗?可是看车辆的运行时间,与保养周期分毫不差,于是赶紧给爱车做了保养,同时也感叹:这厂家真是高啊,经验太丰富了,你的车什么时候做保养都猜得出来,还会打电话提醒,服务真到位!

又过了一段时间,朋友的活越来越少了,收入越来越低,还款就很吃力了,终于有一天,断供了!第二天找到一点活,可是他的车却无论如何也起到不起来了。找了几个修理工来看,都没修好,他只好给厂家打电话咨询。厂家告诉他:你的车断供了,我们通过远程遥控把你的车锁了,只有交完钱才能解锁。朋友这才知道,自己的车一直处于厂家的监控之下。

看到了吗?其实车企对自家的车辆是完全可以监控的。现在的挖掘机上都有一套GPS系统,它可以把车辆的运行数据,包括实时位置、启动时间、怠速时间、工作时间、发动机转速、发动机工作小时、工作模式等实时传回车企,车企可以随时查看你的车辆运行数据,甚至可以控制你的车辆运行。所以他们才能做到提醒你做保养,也可以禁止你的车发动。

不仅仅是贷款购买的车上有这套GPS系统,全款购买的车上也有这套系统,车企也可以随时监控你的车辆。有人说我把这套系统拆掉不行吗?这样车企不就找不到我了吗?对不起,这样做是不行的,现在的车都是电控的,这套系统已经嵌入在发动机控制程序中了,没有这套系统,或者这套系统发生了故障,车辆就无法运行了。

有人说这是挖掘机,与我们私家车有什么关系。其实这个事例可以应用到所有的车辆上,包括工程机械、商用车以及私家车。车企只要愿意,就可以在车上安装这套系统,获取你的车辆运行数据。

那么什么是车辆运行数据呢?所谓的车辆运行数据,就是指车辆在运行过程中的一系列参数,包括车辆实时位置、行驶轨迹、发动机启动与关闭时间、发动机温度、发动机转速、节气门开度、怠速时间长短、发动机持续工作小时、电瓶电压、是否开空调、变速箱档位信息、变速箱换挡模式、车辆的行驶速度、驾驶员操作习惯,等等。可以说,所有与车辆运行有关的参数,都可以看做是车辆运行数据。

有人问这些数据在哪里?我怎么看不到。其实这些数据都储存在汽车的电控单元内部。现在的汽车都是电控的,一辆汽车有多个电控单元,比如发动机电控单元、变速箱电控单元、车身电控单元等,它们互相通讯,共同分享信息,组成了一个网络,通过一个共同的端口对外输出?,这就是汽车诊断接口。我们把汽车故障诊断仪接入到这个接口上,就可以看到汽车的各种运行数据,包括故障记录。这就好像我们使用的手机或者电脑,会记录我们的网络访问记录,而有些程序或者软件会偷偷的扫描我们的电脑硬盘,把我们电脑中储存的文件查看一遍,并分析我们的爱好、习惯等,然后有针对性的给我们推送信息,以提升阅读量。用一句高大上的话来说就是“算法”。

那么这些数据有什么用呢?对于我们车主来说最大的用途就是诊断汽车故障。当汽车运行中发生了某些故障,电控单元就会把它记录并储存下来,用诊断电脑就可以看到,从而快速判断故障部位。而对于车企来说,这些数据就是宝贵的财富,它们可以从中找到并发现车辆运行中的bug,并在之后的生产中加以改进,这样可以持续的改进产品,让汽车运行得越来越顺畅;同时还可以获取用户的驾驶习惯、个人信息等,更有针对性的服务客户,提升服务质量。

举一个例子来说,大众的双离合变速箱,在上市初期,故障率非常高,换档顿挫、异响、动力传输中断等;但你看现在双离合变速箱,故障率非常低了,换档逻辑也更加合理,顿挫感明显减小。这些改进,就是大众搜集了众多的车辆运行数据后,找到了原先运行程序中的bug,在之后的生产中加以修改,让双离合变速箱逐步的完善。其它的例子也很多,比如有些车型上市初期并不完善,在后期会不定期的升级车辆电控单元版本,就是从车辆的运行中发现了原程序中的缺陷,然后加以改正,让车辆持续的得到改进。这就像我们使用的手机或者电脑,需要定期升级系统一样。

那么车企是如何获取我们的车辆运行数据的呢?应该说绝大多数的车企在这方面做得都不是很光彩,他们一般都采用“偷”数据的方式。比如说你的车去4s店维修保养,他们就可以趁着检查故障的机会,获取你的车辆运行数据。还有就是现在很多车都可以实现远程遥控、用APP控制汽车等,这样的控制方式,就会在汽车控制程序中留有后门,车企可以通过这个后门查看你的车辆运行数据。其实有些车型在很早之前就有这些功能,只是车企为了避嫌,一般都是极力否认的。

前两年有一辆奔驰车在高速公路上定速巡航失控了,车辆无法减速停车,以一百二十公里的时速在路上狂奔。那么最后这辆车是如何停下来的呢?直到今天也没有一个明确的说法。不过有人曾经问过奔驰公司,你们是否有能力在后台控制汽车?奔驰公司的回答是不置可否,既不否认也不承认。个人是高度怀疑这辆车最后是奔驰公司从后台控制熄火停驶的。你想想,既然他们可以在后台控制你的汽车,想要获取的你的车辆运行数据还不是易如反掌?他们根本就不需要你的同意,在后台偷偷摸摸的就做了,你还根本不知情。

而现在的电动汽车、新能源汽车,都是以科技著称,车机互联功能几乎是标配。他们都可以实现远程遥控开门、启动等,都可以实现用APP控制汽车,并且自带流量,所以他们想在后台获取你的车辆运行数据是非常容易的。甚至有些车型有后期远程更新程序的OTC功能,在更新车辆程序的同时,也获取你的车辆运行数据,岂不是非常简单的事?还有一款国产电动车,它甚至在车内安装有麦克风和摄像头,可以把车内乘员的谈话记录下来,车企的后台工作人员就可以听见和看见。你想想这是一件多么恐怖的事?我们在车企面前几乎没有任何隐私了!在这样的车里,我们只能闭口不说话,否则你就会体会到“祸从口出”的含义了。

有人说车企不是有试车员吗?他们自己就可以把车上的故障试出来,为什么还要偷我们的数据呢?其实车企的人员、精力、财力都是有限的,不可能每一款车都严格的实验完毕才出厂,很多车都是在半成品的状态下上市销售的。这种情况下后期就会有很多问题暴露出来,如果指望车企自己发现、改进,这个过程是非常漫长的。而使用真实车主的车辆运行数据,就会获得大量的、有实际价值的参数,更快、更好的促使车企改进车辆的缺陷和不足。

本文来源于汽车之家车家号作者,不代表汽车之家的观点立场。

遥感监测汽车不合格是什么意思

“数据 - 数字时代的石油”

“数据是新的石油”

在网络上、媒体上我们经常看到有人这样宣扬。

问题是: 我们能够像提炼石油一样从数据中提炼出价值来吗?

笔者多年从事汽车及出行领域的信息技术(IT)及产品研发,在这里就车联网数据分析的一些实践做个分享,看看能够从这些数据“石油”中提炼点什么,抛砖引玉。

下面的分析是针对单个车辆的车联网数据进行分析,而不是群体车辆的行为分析。

笔者计划从下面几个方面进行探讨(具体的会根据实际情况和各方面的反馈来调整):

- 用户出行行为分析

-?用户驾驶行为分析

-?燃油车车辆动态行为分析

-?电动车电池及充放电行为分析

-?能耗分析

本篇分享一下用户出行行为的分析过程。

先看看车联网数据到底有多大,各家OEM和后装解决方案的数据采集信号、采集频率都不同,也没有行业统一标准。这里举一个例子,让大家粗略感受一下。

- 假设数据采集频率为1 Hz(所有信号每秒采样1次),家用汽车平均每天使用2个小时(燃油车引擎启动就开始采集数据),一年就采集了365 * 2 * 3600 = 2.628 * 106次。

-?如果每次采集的数据量为10 KB,那么,一辆车一年就产生大约26.3 GB 的数据。

-?一年一百万辆装备有车联网的车将会产生26.3 GB * 106= 26.3 PB。(2018年中国有6家OEM年销量过百万)。

- 丰田、大众、雷诺日产2018年全球销量均超过1000万。假设这几家OEM在未来数年内销量均保持这一水平,并且从今年开始实现100%新车车联网,每辆车平均寿命6年,那么6年后这些OEM存量车联网的车就是6000万,每家OEM每年将新增数据:26.3 GB * 60,000,000 = 1578 PB = 1.578 EB/年.

这么大的数据量,采集、传输、存储,如果以现在的技术和市场价格,成本是十分惊人的。所以,笔者大胆猜测,大多数OEM和物流公司在实际运营中都会降低采样频率,或者减少采样信号,或者以事件驱动,而不是以固定频率采样数据,以节省成本,尽管,技术上没有问题。

对上述目标的分析,笔者使用的车联网数据集来自于一辆车联网实验性乘用轿车。数据源本身就是脱敏的,去除了位置信息、用户信息、车辆等静态信息,只有车辆的动态数据。时间跨度为:2017年6月至8月。

采样频率高于1Hz,也就是平均每秒钟采样不止一次。原则上,采样频率越高越好,这样保留了高频信息,可以更加深刻地分析车辆的动态行为。

这几年热得一塌糊涂的无人驾驶,主要传感器的采样频率都不低于10 Hz。为什么采样频率要求这么高呢?比如,在高速公路上以120公里/小时的时速行驶,那么每秒钟行驶的距离是:120000/3600 = 33.3 米/秒。也就是说,在0.1秒的时间里(对应10 Hz),车辆已经行驶了3.33 米,这个距离足以将车辆驶离车道并酿成事故。

有了原始车联网数据(通常以CSV文件格式保存),笔者要对它进行预处理,为后续的数据探索、可视化,以及模型分析准备原料。

笔者使用的工具全程都是 R语言。

如何处理?要不忘初心、牢记使命:本部分数据分析的目的是 – 用户出行行为分析 。

基于该目的,我们所需要的数据项其实很少,只需要下面三项数据就可以了(是不是太简单了点?是的,就是这么简单。就像,都是小麦,光面条就可以做出很多种,更不要说各种面包,还有数不清的 dumpling了):

-?时间戳– 每条记录发生的日期和时间

-?里程表

-?引擎转速– 判断车辆状态

如果有明确的、可靠的信号用于判断车辆状态,那么不建议使用“引擎转速”了。笔者认为这完全取决于实际的数据质量和内容。如果各位大神有更好的解决方案,欢迎分享和交流哦。

把其他的数据项暂时摈弃,只保留这三项,现在可以进行下一步了。

如果上述数据中,不同信号的采集频率不一样,那么,合并(或者叫融合,信号之间的融合)数据是非常重要的一步。合并可以发生在清洗、整理、聚合中间,或之前、之后的某个时间,具体要根据实际数据的情况来决定,很难一概而论。

首先了解选择的数据集的summary信息,可以快速知道哪些字段有数据缺失,有多少缺失。如果有缺失值,需要分析这些数据对我们的分析目的会有什么影响。如果没有什么影响,就删掉它们。

其次,时间戳是以字符串的形式存储的,包括日期和时间,笔者用的数据集精确到毫秒。这样不利于后续的计算和分析。需要把它转化成便于计算和分析的数据。毫秒的精度对我们分析用户出行行为来说没有意义,所以,由时间戳生成年、月、日、时、分、秒,这样,后续可以按照这些时间尺度进行聚合。

最后,按秒对数据进行聚合。选择的数据集高于1Hz的采样频率,但是实际原始数据往往不会100%严格按照相同的采样频率生成数据,有时1秒内有多条记录,有时会有缺失,看起来不是完全连续的。如果是车速等数据,聚合时采用平均值。里程数据是个累计值,所以取每秒内的最后一个数值,为了计算简单,都用平均值也可以,因为1秒内里程数据很难有大的变化。

经过这些步骤后,数据就规整了很多,可以进行下一步了。

将数据分割成一个个单独的驾驶行程,这样可以方便后面的出行行为分析了。

如何判断一个驾驶行程的开始和结束呢?

对于燃油车,一般来说,发动机启动后,才开始采集车联网数据,所以,没有数据就可以假定为车子是熄火的。这里用的数据就是燃油车的数据。

对于纯电动车(BEV),充电的全过程都会采集数据。

对于插电混动(PHEV)车,判断的依据要更加复杂一些,这个问题以后再讨论。

需要注意的是,真实数据通常不可能是理想的,每一步都要仔细检查,如果有疑问,或者不合理,找出那些引起可疑的数据,仔细分析原因,再根据发现的原因进行调整。这是一个不断试验、不断迭代的过程。

完成技术上的分割后,需要合并、过滤,得到相对合理的“有意义的”驾驶行程,在这个示例中,笔者得到了142次驾驶行程。也就是说,从2017年6月至8月的时间里,开了142次车。

处理完这些之后,我们就可以下锅做菜了,看看能不能做出点有意思的东东来吧。

分析的过程通常是由浅入深、由全局到局部。

如果数据足够多,建议先从大的时间尺度开始,比如从年开始,到月、日、小时,再到单个驾驶行程。最后,看看这些驾驶行程之间的关系,行程和各个时间维度之间的关系。一步步深挖。

首先,对整个数据集要有一个总体的认识,这个可以通过统计下面表格中的指标来完成。列出来的指标只是用于示例,具体需要统计哪些值应该根据分析的目的、业务场景、实际的原始数据集等。还是那句话:具体情况,具体分析。

其次,我们看一看该用户每月驾驶(出行)的频次,和旅行的总里程(公里数)。如图1所示,7月份开车的次数和行驶总里程最多,差不多是6月和8月的两倍。

从每月开车的次数来看,7月份开了70次左右,6月份半个月就有接近40次,而8月份仅有34次开车记录。那我们很想知道 8 月份的开车次数为什么减少了那么多呢?

统计一下每天驾驶的次数,如图2所示。结果有些让人意外,6月份从14日至24日(11天),7月份从10至29日(共18天,中间缺了2天),8月份从5至12日,27至31日(总共13天),其他的日期没有车联网数据。接近一半的日期里没有车联网数据。

是什么原因导致的呢?是那些天用户完全没有开车吗?还是由于某种原因,数据没有传输上来呢?

回答这个问题并不难。

我们还是从查看原始数据着手,里程表是不断递增的。比对最后一条记录的里程表和第一条记录的里程表数据得知,两者的差值是5646公里。回想前面表格里统计的“总驾驶里程”为2666公里,这说明在那些缺失数据的日期里,车辆仍然驾驶了接近3000 公里。

这也提醒分析人员,如果再对这批数据按月份进行分析,已经失去了意义。

因为这批原始数据来自于一辆车联网实验性的乘用轿车,我们不能要求太高。但是对我们实践我们的研究方法依然有效。

再前进一步,从日期的角度看看用户驾驶/出行的特征。如图3所示,共统计了三个指标的分布:

1. 左上– 每天驾驶次数的分布,中值是3次,最多有7次。说明该用户开车比较频繁。

2. 右上– 每天行驶距离的分布,中值是63公里左右,最多一天行驶261公里。

3. 左下和右下两张图– 每天驾驶时长的分布,中值在90分钟处,说明该用户每天大约开车一个半小时。用频率图从另一个角度可以看到驾驶时长的分布特征。

在实际工作的时候,分析人员根据实际情况选择该用什么样的图表来更好地展现。

现在分析 单次驾驶的行为特征 。先从最简单的统计特征,单次驾驶距离和驾驶时长,入手。如图4所示,

- 该用户开车的距离多数在10公里以内,或者在30-50公里范围内。

- 每次开车多数分布在5-15分钟内,或者在30-60分钟内。

无论是距离还是时间长度都有两个峰值,是不是有某种背后的原因? 又一次把笔者的胃口吊起来了。

下面我们看一看单次驾驶距离的散点图,如图5所示,每一次驾驶的距离在图中表示为一个小圆点,从6月14日开始的第一次驾驶到8月31日记录的第142次驾驶,总共142个点。

根据前面的距离分布图(图4)得到的启示,我们从下图中可以观察到几个特征:

1. 有一个超过200公里的行程,鹤立鸡群。其余的都没有超过100公里的。

2. 在15公里以下有很多点行驶距离十分接近。

3. 在30-50公里也有很多点的行驶距离十分接近。

我们似乎找到了前述疑问的答案,但是咱们既然是做数据分析,就要显得更加“科学”和“客观”,让数据来说话,而不是凭肉眼观察和猜测,否则,怎么显示出分析师的“逼格”来呢?

如何让数据说话呢? 聚类分析 是个好的工具,尤其是这里只有一个变量,K均值的方法就可以了,简单易行。

一开始,我们并不能确切地知道(假装不知道,这样才能“客观”)该分成几个聚类簇,一个做法是:从K = 1 到n(n 的取值要足够大,以保证最佳簇个数不大于n)都做一次聚类分析,然后比较各个K值下的 Betweens/TSS (簇之间的总平方和 / 总离差平方和),该比值越大,聚类效果越好。一般来说,K值越大,该比值也会越大。极端的情况是,比如,有100个点,分成100个聚类簇,这样当然没有意义。所以这里需要一个主观判断,通常在比值差不多的情况下,应该选择最小的K值作为最佳聚类簇。

在这个例子中,我取n = 10,因为直觉告诉我,最多3或4个聚类簇就够了,在此基础上放宽一到两倍作为n的取值应该足够了。

直觉会告诉我们可能有几个聚类,但是不要完全相信直觉(否则,就不“客观”了),还是应该让数据说话。

这里多啰嗦几句:在做数据分析的时候,直觉很重要,但是笔者建议更多地应该把直觉当成线索、孕育新的想法,就像是侦探破案一样。如果有一些小伙伴一起探索、探讨就更好了,可以时不时地问问:“元芳,你怎么看?”。

好了,把K从1到10循环做聚类分析,将这10个K值对应的Betweens/TSS显示在图上,如图6所示。可以清楚地看到,K = 3 和 K = 4 时,结果非常接近,但是比 K = 2 时显著改善,所以,笔者选定 K = 3 作为最佳聚类簇。

按照K = 3做聚类分析,重新绘制图5:单次驾驶的距离– 散点图,同时用不同的颜色区别聚类簇,如图7所示。

从图中,可以清晰地看出簇1(红色)只有一个点,就是那个单次驾驶距离最大的那个点,超过200公里,再一次鲜艳地鹤立鸡群。

既然簇1(红色)只有一个点,明显是一个特例,就不再深挖了(真相是挖不下去了)。

下面对簇2和簇3分别作进一步的分析。

对簇2(绿色)的驾驶次数,分别按照一天24小时、星期、单次驾驶距离,和单次驾驶时长,作频率分布图,如图8所示。从图中可以观察到下面几个特点:

1. 大部分驾驶行为发生在下午至晚上,以下午3点至5点最多。

2. 周日至周六都有,但是以周二最少。 又是一个线索,不是吗? 值得进一步深挖。限于篇幅,就不再赘述了(累了,歇歇吧)。

3. 驾驶距离大部分不超过10公里。

4. 开车时间大部分不超过20分钟。

好像是一个生活比较有规律的人啊。

同样,对簇3(蓝色)也做同样的分析,如图9所示,仔细观察这些分布图,可以发现下面几个特点:

1. 驾驶的时间十分有规律,大部分发生在早上10 - 11点,和晚上7 - 9点。

2. 周一至周5特别显著,周日完全没有。

3. 驾驶距离大部分出现在30 - 36公里之间。

4. 开车时间大约在30 - 60分钟之间。

从这些特征不难推测,簇3反映的是工作日上下班的驾驶行为。而家里到公司的距离大约30多公里,单程需要开车30分钟至1小时。交通状况还是不错的哦。

平均来看,上班时间大约早上10点,下班时间晚上8点。是不是和某一类熟悉的人群的特征比较吻合啊?有一种似曾相识的感觉。

结合簇2的特征,工作之余,主要在方圆10公里的范围内活动。簇1告诉我们,3个月内仅有一次远门。哈哈,形象更加丰满啦!

一不小心又自嗨了,初当程序员时的毛病,这么多年还是没有完全改掉。别忘了,这3个月里还有一半的日子没有数据呢。

至此,要演示的用户出行行为的分析告一段落了。笔者用到的数据仅有三项:

- 时间戳

- 里程表

- 引擎转速(仅用于推算车辆状态)。

如果辅之以更多的、“相关的”数据字段,我们可以做更加深入的、多个角度的分析。

在这个过程中,如何提出问题、从数据中发现线索、不放弃任何一个疑点,然后像个侦探一样,一步一步地挖掘。坦率地说,这个感觉真的不错。

后续,笔者还会就车联网数据在其他方面的分析,进一步分享,敬请期待!

测量系统分析R&R是什么意思

不合格的遥感车可能是尾气超标。汽车在路上行驶时,电子屏幕会显示尾气超标。如果遥测显示尾气不合格,将面临罚款。交警会给车主开出限期改正通知书,主要根据规定重新验车。

遥感由三部分组成:监视器、捕获系统和显示系统。车辆经过时尾气排放数据超标,遥感检测会通过数据分析记录超标车辆的车牌号。超标车辆的其他详细信息可以通过交管部门的联网数据库了解,然后通知车辆进行维修,再对车辆进行检查。传统的手工检测机动车尾气排放存在诸多不便,不仅耗时长,而且流程长。

车在跑的时候,电子屏幕会显示不合格。这时交警会开出通知,限期尾气超标后,车主需要在15天内到环保部门对汽车排放进行复检。如果没有,那么车主将面临200元的罚款。有的车辆年检期间尾气排放合格,但电子屏幕仍显示不合格,车主还是要检查尾气。尾气检测与年检周期无关。

百万购车补贴

线上车检查有显示吗

测量系统分析R&R是测量系统分析(MSA)中重复性与再现性分析,也叫双性分析。

测量系统分析:MSA--Measure System?Analysis,属于国际汽车通用五大手册之一。

测量系统分析数据是通过测量获得的,对测量定义是:测量是赋值给具体事物以表示他们之间关于特殊特性的关系。这个定义由C.Eisenhart首次给出。赋值过程定义为测量过程,而赋予的值定义为测量值。

扩展资料

测量系统分析的步骤:

(1)确定该测量系统是否具有所需要的统计特性,此项必须在使用前进行。

(2)发现哪种环境因素对测量系统有显着的影响,例如温度、湿度等,以决定其使用之空间及环境。

(3)目的是在验证一个测量系统一旦被认为是可行的,应持续具有恰当的统计特性。

(4)常见的就是“量具R&R”是其中的一种型式。

百度百科-测量系统分析

线上车检查通常不会有实际的显示,因为它是通过计算机程序进行的虚拟检查。线上车检查是基于车辆的基本信息和故障代码进行分析,通过与车辆数据库进行比对,判断车辆是否存在潜在的问题或需要维修的部位。原因是因为线上车检查主要依赖于车辆的数据和故障码,而不是实际的物理检查。

线上车检查的优势在于它可以迅速检测和识别车辆潜在的问题,提供初步的故障诊断和建议。它可以帮助车主在出现问题前及时了解车辆的状况,及时采取措施进行维修或保养,以避免问题的恶化。此外,线上车检查还可以提供一些基本的维护提示和建议,帮助车主保持车辆的良好状态。

然而,线上车检查也有一些限制。由于它主要依赖于车辆数据和故障码的分析,可能无法完全准确地检测出一些复杂或隐藏的问题。因此,在线上车检查后,如果存在疑问或问题仍然存在,建议进行实际的物理检查,以确保车辆的安全和可靠性。

总之,线上车检查是一种方便快捷的初步检查方法,可以帮助车主及时了解车辆的状况,但它的结果需要结合实际情况进行综合判断和进一步检查。