第13届ACMRecSys会议:基于损失函数的神经网络模型在推荐系统中的最新应用

  • 时间:
  • 浏览:0

2019 年 9 月 16 日至 20 日,第 13 届 ACM Conference on Recommender System(RecSys)在丹麦哥本哈根召开。作为推荐系统的顶会,RecSys 一如既往受到了业界的广泛关注。与一些机器学习会议相比,RecSys 一向重视正确处理实际的大问题,即结合在实际应用场景中推荐系统性能提升、效果提高等大问题提出设计策略和算法正确处理方案等。

随着高度学习研究的进一步深入,高度学习在推荐系统中的应用依然是研究热点之一,本次会议对神经网络(Graph Neural Network,GNN)、经典高度学习模型都是所应用及改进。

应用于广告展示的推荐系统面临的曾经重要难点是,不可能 季节性、广告活动的变化和一些因素,广告价值形式分布和点击率(click through rate,CTR)会随着时间而趋于稳定巨大的变化。正确处理你这一 大问题的主要策略是不断地基于新数据连续训练预测模型。然而一些应用场景中数据标签仅趋于稳定一段时间且会突然老出一定的随机延迟,哪几种延迟的反馈标签对连续训练中的数据新鲜度提出了挑战:新数据在被训练算法接收时不可能 很难 完整性的标签信息。曾经简单的正确处理你这一 大问题的方案是除非用户给数据打正标签,而是任何曾经数据点都是曾经负样本。你这一 方案往往带来较低的 CTR,从而原因分析分析用户体验差和性能差。

本文的重点是找到推荐系统中损失函数和高度学习模型的最佳组合,使其在趋于稳定标签延迟反馈的具体情况下,也能从连续数据流中进行有效的大规模学习。本文考虑四种 模型:一是简单 Logistic 回归模型,该模型应用简单、性能良好以及易于接收和正确处理在线训练的新训练样本,在展示广告中得到了广泛的应用。二是广度-高度(wide-deep)模型,该模型也能有效正确处理推荐系统的价值形式僵化 性和多样性大问题。此外,本文考虑四种 损失函数:对数损失、假阴性(fake negative,FN)加权损失、FN 校准、正未标记损失和延迟反馈损失。

本文是首次使用高度学习模型来评估展示广告中的概率 CTR(pCTR),同去正确处理数据标签延迟反馈大问题。考虑到不可能 时间成本较高,高度神经网络很难在在线训练中应用,本文在不增加工程成本的具体情况下,对延迟反馈大问题进行基准测试并提出时间成本可行的正确处理方案。

模型分析

本文提出了四种 连续训练机制,假设前提是等待时间有限长的时间也能得到广告的正向参与标签。针对你这一 类大问题,传统办法一般是预先给定样本数据负标签,直到用户标记后改为正标签。有偏数据分布,即观测到的分布具体情况,蕴藏了标记为负的实际数据分布的所有样本。

本文考虑四种 学习模型,简单 Logistic 回归模型和广度-高度(wide-deep)模型。

(1)简单 Logistic 回归模型

本文使用标准 Logistic 回归模型,该模型在展示广告领域得到了广泛的应用。

其中 sigma(.) 表示 sigmoid 函数,输入 x 是与特定请求的用户和候选广告相关的数千个价值形式的稀疏表示。

(2)广度-高度模型

广度-高度模型蕴藏曾经组成偏离 :广度模块(广义线性模型)和高度模块(标准前向-后向神经网络)。广度模块正确处理原始输入价值形式和转换后的价值形式,类事交叉产品价值形式,将非线性价值形式打上去到广义线性模型中。而高度模块主而是将高维稀疏价值形式转化为嵌入向量,从而将分类价值形式转换为密集的低维表示。广度-高度模型对 CTR 的预测如下:

其中,w_wide 表示广度模块的权重,w_deep 表示高度模块的权重,phi(x) 表示交叉产品变换,alpha 为深支末级激活。

损失函数分析

(1)延迟反馈损失(delayed feedback loss)

在延迟反馈损失函数中,假定时滞服从指数分布,并将此模型与 Logistic 回归或高度模型联合训练。参数θ和 w_d 的正则对数似然优化为:

其中 alpha 为正则化参数,L_DF 表示为:

f_θ(x)对应 pCTR 模型的输出,d 对应于点击曾经正样本的时间,而 e 代表自广告播放以来经过的时间。延迟反馈损失函数的数值计算格式为:

(2)正未标记损失(positive-unlabeled loss, PU 损失)

本文在 FN 设置下使用正未标记(positive unlabeled,PU) 损失,将有偏训练数据中的所有负样本视为未标记。损失函数为:

该损失函数可不想到看作是对正样本和负样本的传统对数损失。此外,假使 观察到曾经正样本,就向负梯度的相反方向递进。你这一 假设是合理的,不可能 对于每个正样本,都是基于假负样本梯度的参数更新。

(3)假阴性加权损失(fake negative weighted,FN 加权损失)

你这一 损失依赖于重要性抽样。在本文的训练设置中,样本被标记为负后进入训练队列,一旦用户参与后立即使用正标签进行群克隆。给定下面的假设:

其中 b 为偏移观测分布,p 为真实数据分布。不可能 所有样本数据初始标签都为负,统统有:

假阴性加权损失函数为:

L_IS 对于 f_θ的梯度为:

当∂L_IS/∂f_θ = 0 时,f_θ (x) = p(y = 1|x)

(4)FN 校准(fake negative calibration)

FN 校准中,模型估计偏移分布 b,L_IS(θ) 中 p(y=1|x) 改为:

不可能 对于偏移分布中的每曾经正分布都能观察到 FN,即 b(y=1|x)≤0.5 和 p)y=1|x≤1,该分布始终有效。

实验设置

(1)离线指标

实验目的:离线指标实验目的是验证所提出的损失函数是是是否是是适用于 CTR 预测大问题,并用曾经不同的数据集(曾经内部内部结构数据集和曾经公共数据集)对模型进行了训练和测试。

评价指标:Log 损失(Log loss)、相对交叉熵(relative cross entropy,RCE),精确召回曲线下面积(area under precision-recall curve, PR-AUC)。

(2)在线指标

实验目的:在线指标实验目的是对离线具体情况下效果最优的模型和损失函数进行进一步评估。在线指标反映了不同办法正确处理延迟反馈大问题的实际性能。

数据库:以 Twitter 数据的延迟评估数据集执行评估,比较「控制」和「正确处理」(在 A/B 测试框架中)之间的性能。评估时候时候开始了后 9 小时内删除假负样本标签。

评价指标:集合相对交叉熵(pooled RCE)、每千个请求收益(revenue per thousand requests,RPMq)。

(3)参数

本文在在线和离线实验中均使用随机梯度下降优化算子(stochastic gradient descent,SGD),学习带宽为 0.02,衰退带宽 0.000001,批正确处理大小为 128,延迟反馈损失学习带宽为 0.005,延迟反馈模型的 L_2 正则化参数为 2。广度-高度模型中 4 层模型大小为 [50,50,50,50],上面层使用 ReLu 激活函数。权重参数使用 Glorot 优化。

(4)数据

离线实验中使用 Criteo 公开数据库。此数据库描述单击后的转换,而是与 CTR 预测相比,时间延迟通常更长。每个样本由一组散列分类价值形式和多少连续价值形式描述。训练样本总数为 1550 万个,测试样本为 350 万个。为了从原始的公共数据集中创建伪负数据,执行以下过程:使用最新的转换时间或单击时间作为快照时间,并在单击所有正样本时引入伪负样本。原始数据集用于验证 Logistic 和延迟反馈损失函数估计的实验,而蕴藏单击时 FN 样本的数据库则用于评估 PU、FN 加权和 FN 校准损失函数。

对于离线指标实验中的内部内部结构数据,使用线下 Twitter 4 天的数据。评估过程是基于第半个月的数据进行的。不可能 仅有一小偏离 广告提供了用户点击功能,数据标签的严重不平衡给算法带来了很大难度。为正确处理你这一 大问题,本文的训练设置中将负样本减少到原始数据集的 5%,而是在损失函数中对负样本采用更高的权重。经过上述正确处理,训练样本约为 6.68 亿条视频广告,而测试数据为 700 万条广告。

在线指标中使用 Twitter 在线库,在在线实验中,所有的模型都是曾经连续的数据流上进行训练,你这一 数据流是由回调数据实时生成的。将每个训练样本发布到模型的训练服务订阅的数据流中。连续训练过程每 10 分钟输出曾经模型,而是由预测服务提取哪几种模型以服务于在线场景。

实验结果

(1)离线评估

基于 Criteo 公开数据库的离线实验结果在表 1 中。使用延迟反馈损失函数产生的 RCE 最高(17.32),其次是 FN 校准损失函数(RCE 为 17.29),与 Log 损失的 RCE 持平。使用 PU 损失函数的结果最差,且在不同循环轮次实验中效果也最不稳定。实验结果表明,延迟反馈损失函数更适合于简单的 pCTR 模型(类事 Logistic 回归)和较少的训练样本。对于僵化 的广度-高度模型则不到更稳健的正确处理方案,类事应用重要样本抽样策略等。

表 1. 基于公共 Criteo 数据的线性模型的离线结果。

使用离线 Twitter 数据的实验结果在表 2 和表 3 中,分别用的是 Logistic 回归模型和广度-高度模型。由实验结果可知,广度-高度模型在应用不同损失函数的具体情况下,效果都优于 Logsitc 回归模型。

表 2. Twitter 数据的 Logistic 回归模型离线结果

表 3. Twitter 数据的广度-高度模型离线结果

(2)在线评估

表 4 给出使用最优损失函数的广度-高度模型结果。应用 FN 加权损失函数和 FN 校正损失函数的 RPMq 值均高于传统的对数损失函数(分别提升了 55.10% 和 54.37%)。

表 4. 广度-高度模型以及性能最佳的损失函数(Twitter 数据)的在线结果

总结与分析

本文重点研究具有损失函数的神经网络模型在连续学习过程中的延迟反馈大问题。由本文的分析可知,对于损失函数的选者需重点考虑梯度的时间依赖性,即基于伪负样本的参数更新先于来自正样本的更新。基于本文工作,后续考虑将重要样本抽样策略与时滞建模相结合,为训练样本分配与时间相关的权重。此外,还将继续研究连续学习中的一些大问题,类事灾难性遗忘和过度拟合,以及研究更系统的办法来正确处理数据集偏差。

图神经网络(GNN)是四种 有效的关系表示办法。应用于推荐系统 GNN 还趋于稳定一些难点,类事僵化 的噪声连接和高度的异构性、过平滑等。本文提出了四种 新的图嵌入办法——异构图传播(Heterogeneous Graph Propagation, HGP)来正确处理哪几种大问题。HCP 使用 组-用户-项目(group-user-item)三偏离 图作为输入,以减少大规模社会化推荐系统图中的边缘数和路径僵化 性。为了正确处理过平滑大问题,HCP 将节点嵌入到曾经基于 PageRank 的个性化传播方案中,分别用于组-用户图和用户-项目图。每个图中的节点嵌入使用注意力机制进行集成。

模型分析

GNN 有多重不同的架构,本文基于图卷积神经网络(Graph convolutional networks)价值形式的 GNN 来正确处理属性化的多重异构网络,同去利用了个性化的 PageRank 方案。对于社会化推荐系统来说,项目、用户和社会关系构成了节点和边类型多样的僵化 网络。单纯地将传播方案直接应用到异构图中,不可能 会原因分析分析对具有优势的边缘的偏差训练。本文提出的 HCP 也能独立地传播偏离 边类型的邻域,而是将最终的节点表示与注意力模型相结合。

对于曾经异构图 G,节点映射函数为ϕ : V → O,边映射函数为ψ : E → R。Ar 表示蕴藏类型为 r 的边的邻域矩阵。Aˆr 表示 Ar 的对称规范化邻接矩阵。将节点划分为不同种类:X1,X2, ...,X|O|,分别应用预测神经网络 Hi=f_i(Xi),将结果连接起来得到:H =[H1,H2, ...,H|O |]。HGP 使用具有附加可学习权重的非线性传播来学习高度节点表示:

将最终的节点表示矩阵与注意力模型(attention model)相结合。在保持通用性的前提下,一些人从 z(k)_r 中为偏离 边缘类型选者第 i 个节点(行)。将哪几种向量叠加形成曾经矩阵 Y_i,使用单层传感器的注意力模型:

其中,d_k 表示输入查询和键的维度。利用该模型,HCP 对 Y_i 进行注意力计算如下:

其中,查询、键和值是相同的,而是基于不同的权重矩阵相乘。而是,HGP 将 Y′_i 的所有行连接起来,并将其传递给线性层,生成第 i 个节点的表示向量 z_i。在本文提出的社会化推荐系统的应用中,计算用户和项目表示之间的点积类事性来预测 CTR。

其中 X_i 是价值形式矩阵 X 的第 i 行向量。本文利用随机梯度下降算法,通过降低交叉熵损失来优化模型。递归的跨层邻域扩展不到消耗多量的时间和较高内存来训练大而密集的图,本文通过调整采样概率使其与偏离 类型的节点数成比例来正确处理你这一 大问题。为了减小近似方差,采样概率与节点的阶数成正比。HGP 完整性的模型架构见图 1。

图 1. 应用于社会化推荐系统的 HGP 的示意价值形式。HGP 为偏离 边缘类型独立地传播邻域,而是将最终的节点表示与注意力模型相结合。本文计算用户和项目表示之间的点积类事度来预测 CTR。

实验分析

数据库:本文使用从大型社交网络挂接的数据库,蕴藏组、用户和项目四种 节点类型。当用户属于同一组,则组和用户节点相连。与传统图中组所有用户都连接的办法比较,组节点有效地减少了边的数量和路径的僵化 性。当用户与项目有交互行为时,项目和用户节点相连接。数据库中共有 1645279 个节点连接 4711208 个边。使用 BERT 和 VGG16 提取视觉语言属性的高级价值形式。利用线性嵌入层将分类属性转化为密集价值形式。最后,聚合所有价值形式来表示节点。使用前 11 天的数据作为训练集,然后 2 天的数据作为验证集,最后 4 天的数据作为测试集。

对比模型:metapath2vec、metapath2vec+EGES、MNE+EGES、FastGCN、HGP。

验证指标:ROC-AUC、PR-AUC、F1 score。

实验平台:NAVER Smart 机器学习平台(NSML)。

表 1. 对比模型的性能比较。连字符「-」表示不可能 结果趋于稳定较大方差,无法得到稳定的性能。

对比实验结果见表 1,由实验可知,PR-AUC 和 F1 值与 ROC-AUC 成正比。不使用节点属性的 metapath2vec 无法完成 CTR 预测。HGP 的性能优于 FastGCN,这是不可能 FastGCN 趋于稳定过平滑大问题,不适用于异构图。HGP 性能优于一些异构图网络模型。此外,HGP 的验证损失也能在半天内收敛,因而也能满足实际应用场景中推荐系统所需的服务模型日常更新的要求。

图 2. 不同传播步骤下的 HGP 性能比较

图 2 给出不同传播步骤下 HGP 的性能。HGP 不到为宜曾经步骤也能获知统一组内一些节点的信息(用户节点→组节点→用户节点)。不可能 传播步骤为 4 步,则可不想到接近具有同去偏好的用户的一些首选项(用户节点→组节点→用户节点→组节点)。传统架构的性能随着传播步骤数目的增加而降低。而 HGP 在步骤为 10 时达到最佳性能,并成功地正确处理了过平滑大问题。

总结与分析

本文提出了四种 应用于社会化推荐系统的图价值形式,即群-用户-项目三方的多重异构网络。本文提出的图形配置方案将计算时间和内存消耗减少为节点数的平方,组节点的属性有有利于挖掘用户之间的社会关系。此外,本文还提出了四种 基于图的推荐办法,称为异构图传播(HGP)机制。为了正确处理过平滑大问题,HGP 使用个性化 PageRank 方案传播邻域信息。HGP 也能有效趋于稳定理图的异构性。为正确处理扩展性大问题,本文采用了适合于异构环境的采样办法。后续可不想到通过打上去一些社会属性(如地址、教育背景和同去兴趣)等来扩展图表,从而有效提升社会化推荐系统的效果。

普适计算采用分布式和嵌入式设备随时随地完成通信和数据正确处理。随着手机的推广使用、手机性能的提升以及网络通信能力的提升,普适计算的应用价值很难 高。本文重点研究离线手机端与邻近区域内一些设备之间推荐评分数据的交换大问题。本文提出了四种 传播和过滤策略,将传统的寻找类事的对等设备和交换项目偏好的办法从分散领域转化为普适推荐系统大问题。同去本文还给出了曾经移动程序运行运行运行原型,实现了所提出的设备到设备的信息交换。

普适计算模型选者

近年来,随着数据获取、存储、正确处理的渠道很难 来太少,关于数据隐私保护的技术受到很难 来太少的关注。欧盟于 2018 年 5 月通过了《通用数据保护条例》,针对数据正确处理、获取等提出了严格的限制,而是哪几种限制仅等待时间在用户规则的层面,暂且涉及技术层面的约束。

目前,正确处理大规模授权数据池隐私大问题的推荐系统架构主要有四种 :一是,联邦学习(Federated Learning),基于分布在客户端中的数据,通过中央服务器和客户端之间的通信生成集中的推荐模型。二是,分散推荐系统,在很难 中央服务器的具体情况下,分布式客户端直接对等通信交互。它们通常建立在使用八卦机制(Gossip)的文件共享对等网络的基础上,在对等节点加入或网络扰动的具体情况下,建立起用于快速网络搜索和网络恢复的逻辑覆盖网络。三是,基于位置感知推荐的普适系统,不想将本地数据传输到中央服务器进行推荐。

在这四种 办法中,本文认为普适推荐系统效果最好。一是,不可能 智能手机四种 的数据和移动计算能力提升,使得在智能手机端训练和心成推荐模型变得更加可行。二是,普适系统中推荐模型构建过程仅在设备上完成,而是对网络连通的具体情况很难 任何要求。本文提出了四种 基于 Gossip 机制的普适推荐系统数据传播和过滤策略,利用 Google 的 Nearby Connection API,通过安卓手机程序运行运行运行的办法实现了传播过程。

策略分析

本文提出四种 基于运动中的人携带的移动设备的推荐数据传播策略。当设备物理空间位置靠近时,设备之间会进行后台数据交换,完后 进行设备内的定制过滤过程。作者将此办法称为传播(Propagate)和过滤(Filter)。

图 1:Propagate 和 Filter 提出的四种 数据类型及其在传播中的应用

整个传播和过滤机制的设计流程如下:

a. 数据类型定义

规定每个设备携带四种 类型的数据(参见图 1),基于四种 类型的数据生成本地个性化推荐。

对等首选项列表(Peer Preference List):对等设备中评定的项目列表,数据格式为二进制数或标量等级。在本文的原型实现中,对等设备中实现对电影的分级打分,其中每个电影都由公共可用的网络电影数据库(Internet Movie Database,IMDb)提供的唯一标识符进行标识。对等首选项列表数据保趋于稳定设备上。

邻域首选项列表(Neighborhood Preference List):每曾经节点将完后 从 k 个最类事的节点挂接到的打分数据整合到曾经项目评分列表中。而是,它是未知对等设备中数据子集的首选项列表。邻域首选项列表也能传播给一些对等设备,同去每个对等设备也也能控制将另一方的哪几种对等首选项列表传播到附过对等设备中。

类事数据(Similarity Data):任何类型的数据都可用于计算对等类事度。类事数据也能传播给附过的对等设备,而是不到保证其隐私性。隐私保护类事性比较可不想到在项目向量和文本数据上进行。

上下文数据(Context Data):用于描述价值形式的数据,如位置、时间、天气或对等活动(跑步、吃饭、通勤)等,也能被感知(类事通过传感器)或检索(类事通过网络)。

b. 传播

当曾经或多个对等设备在物理空间上相互靠近时,智能手机建立快速和安全的配对连接,并交换一些人的邻域首选项列表和类事数据。在上述传播过程中,接收到的数据蕴藏上下文数据,类事描述相遇的时间或位置。

c. 过滤

传播过程中挂接到的数据蕴藏多量未过滤的原始数据。为了得到有用信息,不到通过类事性进行数据过滤。从对等设备接收到数据后,设备时候时候开始了了执行过滤过程。首先,基于类事数据对比发送方和接收方的类事度;第二,不可能 对等类事度高于 k-最高值,则基于 k-最类事对等设备的对等首选项列表和邻域首选项列表对邻域首选项列表进行重新采样;第三,基于本地可用的数据运行推荐算法,以获得新的或更新完后 生成的推荐评级结果。

d. 通过断开连接实现隐私保护

传播和过滤的传播过程通过特殊的办法在邻近的智能手机之间建立无线连接,交换类事数据和邻域首选项列表,而是终止连接。此时网络拓扑价值形式基本上是断开的,很难 可利用的对等关系信息(类事,社交网络、推荐系统或车辆网络中的对等网络重叠具体情况等)。也能访问到的对等方的数据总量由连接时间和对等方公开的数据量所决定。

e. 增强本地可用的配置文件数据

Gossip 协议不到曾经连接的对等网络以便聚合类事的对等设备,同去通过对等采样保持网络连接。在传统的分散推荐系统中,为了实现对等采样,即使项目和对等设备都是在邻域空间内,即它们在网络中随意移动,仍不到保证网络连接。当曾经对等设备从曾经类事的对等设备接收数据时,会重新取样他/她的邻域偏好列表;不可能 都是类事对等节点,则哪几种而是做。而是,传播和过滤会创建曾经恒定的项目推荐清单,清单也能在类事的对等设备之间流转,而不想在不同的对等设备之间流转。该属性允许在从未在地理位置上彼此接近的对等设备之间传递信息,并正确处理不同对等节设备间的信息传输。从你这一 意义上讲,传播和过滤正确处理了普适推荐系统容易突然老出的数据稀缺性大问题。

应用具体情况

基于本文的算法不可能 开发完成了曾经 Android 移动程序运行运行运行,且在 Google Play 商店中提供(https://play.google.com/store/apps/details?id=de.tub.affinity.android)。该程序运行运行运行的活动共享模式为广播-发现,即设备向其近邻的其它设备发送广播,同去侦听其它设备的广播。共享过程由 Google Nearby Connetions API 正确处理 (https://developers.google.com/nearby/connections/overview),完整性在后台运行。当曾经手机端相互连通,更慢交换评分数据并将数据存储在本地,值得注意的是,在评分数据交换的过程中手机暂且不到联网。

本文应用场景数据为在 IMDb 中注册和唯一标识的电影。电影的评分结论为 1 到 5 星不等,并以格式如下格式存储:(用户 ID、电影 ID、评分数据)。电影分级列表实现了对等首选项列表。一旦用户完成了评级打分,他/她就可不想到激活共享。

实验分析

本文进行了八个不同的实验,设备为 Nexus 5 智能手机,手机具备最新的蓝牙版本(包括 BLE)和 Wi-Fi 连接功能。

a. 多量评分数据共享:共享评分数据约为 50 条,大小为 50KB。一旦建立连接,完整性 50 条数据同去立刻传输,且不想丢失任何数据。

b. 在多个设备之间共享数据:在八个智能手机之间共享评分数据,这八个手机的评分是独立不相交的。评分数据得以正确和无损的传输。

c. 公共交通工具中的数据共享:一些人成功地在柏林的公交车和地下铁的曾经设备之间共享评分数据,哪几种设备暴露在一些 WiFi 和蓝牙干扰信号下。实验表明,瞬时的网络连接中断暂且会影响数据传输。一旦重新建立网络连接,共享的占位推荐信息被经由开放电影数据库(http://www.omdbapi.com/)API 获取得到的电影元数据填充。

d. 有效传输范围:在蕴藏蓝牙、BLE、Wifi 等通信 API 条件下,二类设备类事手机等一般有效的传输半径为 10 米。本文在室内和户外 3 至 12 米无障碍半径范围内进行实验,实验结果见表 1。实验结论是,评分数据的有效传播半径在 3 到 6 米之间。

表 1. 不同传输范围的连接成功率

e. 平均初始连接延迟:测量曾经设备的初始连接延迟,即在建立连接完后 所需的时间。为保证成功连接,设备之间距离为 1 米,连接是通过不同的程序运行运行运行实现的(待连接设备的 ID 不出缓存中)。平均连接延迟为 25.9 秒,最小连接延迟为 11 秒,最大连接延迟为 41 秒。

f. 电池耗尽:不可能 广播和发现步骤(预连接)不到连续执行,而是通过实验验证长时间在后台进行广播、发现和共享信息是是是否是是可行。不可能 无法模拟现实场景,而是只测量程序运行运行运行的预连接电池消耗量,这就为电池消耗量提供了曾经下限。将曾经设备重置为出厂设置。跟踪四种 不同具体情况下的电池电量:(1)在后台运行并打开共享的程序运行运行运行;(2)关闭共享的程序运行运行运行;(3)出厂设置条件下,在所有四种 具体情况下,显示器都关闭。实验结果见表 2。

表 2. 预连接的平均电池消耗(广播和发现)

实验结果表明,本文提出的传播-过滤策略在大规模评分数据和多设备交互的具体情况下,以及在诸如地铁等很难 互联网连接的地区,都可不想到可靠工作。当然,该策略目前还趋于稳定一定的局限性。首先,数据的可靠传输半径为 6 米,你这一 方面加强了隐私保护,另一方面却限制了也能共享数据的潜在对等设备的数量。第二,平均初始连接延迟(25.9 秒)过长,这就造成了经过的行人之间,或在红绿灯处等待时间、在咖啡馆或餐厅中彼此相邻或乘坐公共交通工具等场景中该策略都是适用。第三,电池的耗电量相对较高,每小时为宜耗电 5%,这就造成无法持续广播和发现。

总结与讨论

后续工作重点是启动移动程序运行运行运行来挂接使用数据。本文中的策略对采样过程和推荐算法都采用保留占位符的办法,一旦也能挂接使用数据,就可不想到测试采样和推荐策略的不同组合。此外,还将继续挂接和评估用户对程序运行运行运行的反馈,包括用户界面和用户体验等。

作者介绍:仵冀颖,工学博士,毕业于北京交通大学,曾分别于香港中文大学和香港科技大学担任助理研究员和研究助理,现从事电子政务领域信息化新技术研究工作。主要研究方向为模式识别、计算机视觉,爱好科研,希望能保持学习、不断进步。