如测量人员技术不熟练,量具使用不当或者视力较差等原因引起的测量误差。1)随机误差及其处理随机误差是指在同一测量条件下,多次测量同一被测量时,误差的绝对值和符号没有确定变化规律的误差。④抵偿性随着测量次数的增多,随机误差的算术平均值趋于零。实验对比法是用不同的仪器进行测量,通过对比测量结果发现系统误差的方法。......
2025-09-29
用户画像涉及大量的数据处理和特征提取工作,往往需要用到很多数据源,且多人并行处理数据和生成特征。数据不说谎,数据是构建用户画像的核心依据,建立在客观数据基础上的用户画像才是有说服力的。在基础数据采集方面,可以通过列举法,先列举出构建用户画像所需要的基础数据。构建用户画像是为了还原用户信息,因此数据来源于所有用户相关的数据。对于用户相关数据的分类,引入一种重要的分类思想,即封闭性的分类方式。如,世界上分为两种人:一种是学英语的人,一种是不学英语的人;客户分三类:高价值客户,中价值客户,低价值客户;产品生命周期分为:投入期、成长期、成熟期、衰退期;所有的子分类构成了类空间的全部集合。
这样的分类方式有助于后续不断枚举并迭代补充遗漏的信息维度,不必担心架构上对每一层分类没有考虑完整而造成维度遗漏留下扩展性隐患。另外,不同的分类方式根据应用场景和业务需求的不同,按需划分即可。参考相关案例及推荐,可以将用户数据划分为静态信息数据、动态信息数据两大类。
用户数据分类如图9-2所示。
(https://www.chuimin.cn)
图9-2 用户数据图
静态信息数据为用户相对稳定的信息,主要包括人口属性、商业属性等方面数据。这类信息自成标签,如果企业有真实信息则无须过多建模预测,更多的是完成数据清洗工作。动态信息数据为用户不断变化的行为信息,广义上讲,一个用户打开网页或买了一个杯子与该用户傍晚溜了趟狗,白天取了一次钱,打了一个哈欠等一样都是用户行为。当行为集中到互联网,乃至电商,用户行为就会聚焦很多,如图9-2所示:浏览凡客首页、浏览休闲鞋单品页、搜索帆布鞋、发表关于鞋品质的微博、赞双十一大促给力的微博消息等均可看作互联网用户行为,本书仅以互联网电商用户为主要分析对象,暂不考虑线下用户行为数据。
数据采集完后还要对其进行处理,主要是清洗无用数据,并将获取的数据进行规范化处理,使之可以在分析建模中可以直接被应用。
相关文章
如测量人员技术不熟练,量具使用不当或者视力较差等原因引起的测量误差。1)随机误差及其处理随机误差是指在同一测量条件下,多次测量同一被测量时,误差的绝对值和符号没有确定变化规律的误差。④抵偿性随着测量次数的增多,随机误差的算术平均值趋于零。实验对比法是用不同的仪器进行测量,通过对比测量结果发现系统误差的方法。......
2025-09-29
船厢主要承载结构的材料为Q345C。主纵梁是船厢的主要受力结构,采用薄壁箱形梁结构。根据三维有限元计算,船厢结构的应力水平较低,吊耳等局部应力较高的部位,通过加强处理,可以使应力有效降低。限于升船机施工现场的实际条件,船厢结构无法采取整体浮运的方式进入船厢室,只能采取分块制造,在船厢室现场拼装的方案。各单元制造完毕后,在厂内对船厢结构进行整体预拼装,船厢设备则在主体结构现场拼装后安装。......
2025-09-29
图4.2-60 提取进口总压对话框图4.2-61 提取转子部件转矩对话框表4.2-1 提取转子部件扭矩的面这里首先要讲的是轴向力的提取步骤,通过轴向力的提取,分析设计是否合理。图4.2-63所示为后处理得到的性能曲线及设计参数的对照。图4.2-64 后处理几何体一般在计算后,首先要提取进出口压强、叶轮转矩等,从而计算出整个泵的单机及整机的扬程、功率、效率等结果,对比设计工况和真实实验值,从而判断数值模拟的正确与否。......
2025-09-29
基础地理数据来源广、类型多,主要来源于地图导航与位置服务供应商、官方组织公开的地理信息数据集等。通过官方组织,可以获取包括湖泊、土地利用等数据。中国湖泊数据集:国家青藏高原科学数据中心结合Landsat影像、地形图,利用半自动水体提取及人工目视检查编辑,完成了过去50多年来详细的中国湖泊数量与面积变化研究,可提供TIFF格式数据。......
2025-09-29
图1-49钢座套与铁芯相碰1—钢座套与铁芯相碰处;2—夹件;3—铁芯;4—锯短后的钢座套处理方法是将太长的钢座套锯短,使钢座套与铁芯表面硅钢片之间保持不小于5mm 的距离。......
2025-09-29
不同钢种的工件经渗铬处理后能获得各种优良性能,以满足不同用途的需要。渗铬后的热处理视基体材料而定,可以不考虑渗铬层,因为热处理对渗铬层组织影响不大。装箱后控制升温至1050~1100℃渗铬,保温到所需的渗层厚度后,炉冷至600~700℃,再在空气中冷却至室温。真空渗铬通常在0.133Pa的真空度下进行,常用温度为1100~1150℃,保温时间根据要求渗铬层的厚度而定。......
2025-09-29
根据仪器对数据采集装置的技术要求的不同,可以构成不同结构的数据采集装置,这就要求能按照需求去构成一个具有高性价比的数据采集系统。在确定数据采集系统的结构时,需要认真考虑参数变化的速率、分辨率、精度和通道数等问题。图6-4分时采集系统的另一种结构形式2.同时采集系统同时采集系统的结构形式如图6-5所示,每个通道有一个IA和一个ADC。由于各个通道能同时进行A/D转换,因此,这种方案适用于高速的数据采集系统。......
2025-09-29
为保证测量的正确性,必须保证测量中单位的统一,为此我国以国际单单位制为基础确定了法定计量单位。测量精度是指测量结果与真值的一致程度。任何测量过程总是不可避免出现测量误差。量规检验不能获得被测几何量的具体数值。间接测量法存在基准不重合误差,故仅在不能或不宜采用直接测量的场合使用。......
2025-09-29
相关推荐