国内O2O的大肆补贴,滋生了一个产业链,即所谓的“羊毛党”和“刷单”。有一批人对搜集各大电子商城、银行、实体店等各渠道的优惠促销活动、免费业务之类的信息产生了浓厚的兴趣。他们有选择地参与活动,从而以相对较低成本甚至零成本换取物质上的实惠。这一行为被称为“薅羊毛”,而关注与热衷于薅羊毛的群体就被称作“羊毛党”。早前,“羊毛党”们主要活跃在O2O平台或电商平台。另外随着2015年互联网金融的发展,一些网贷平台为吸引投资者常推出一些收益丰厚的活动,如注册认证奖励、充值返现、投标返利等,催生了以此为生的投资群体,他们也被称为“P2P羊毛党”。这部分用户与网购羊毛党不同,只关注互联网金融产品。
刷单是店家付款请人假扮顾客,用以假乱真的购物方式提高网店的排名和销量,从而获取好评吸引顾客,即由卖家提供购买费用,帮指定的网店卖家购买商品提高销量和信用度,并填写虚假好评的行为。通过这种方式,网店可以获得较好的搜索排名,比如,在平台搜索时按“销量”搜索,该店铺因为销量大(即便是虚假的)会更容易被买家找到。刷单一般可分为两种:一是单品刷销量为做爆款等做准备;二是刷信誉以提高店铺整体信誉度。还有一种刷单更为直接,以外卖软件为例子,同一个人使用两台手机,分别安装客户下单软件和商家接单软件,一下一接,捞取补贴。我们使用脱敏的测试数据来演示下疑似刷单的情况。
测试样本分为两部分,一部分记录了设备指纹对应安装的App以及App的登录名:
hid=1,uid=mike,app=app1 hid=2,uid=tony,app=app1 hid=1,uid=john,app=app2 hid=2,uid=john,app=app2
字段含义分别为:
·hid,硬件指纹,唯一标识一台设备;
·uid,App的登录用户名;
·app,App的名称。
一部分记录了App的登录名以及下单接单情况:
hid=1,uid=mike,action=buy hid=2,uid=tony,action=sell
字段含义分别为:
·hid,硬件指纹,唯一标识一台设备;
·uid,App的登录用户名;
·action,用户行为,是下单还是接单。
逻辑上对应的拓扑结构如图13-23所示。
图13-23 疑似刷单示意图
从拓扑图可以看出来,虽然两台设备hid1和hid2登录账户不一样,但是他们共同安装的App2上的登录用户名相同,从而可以判断这两台设备属于同一个人,该人疑似使用这两台设备分别扮演买家和卖家进行刷单行为。
逐行处理样本文件,获取对应的hid,uid,app字段:
with open("../data/KnowledgeGraph/sample3.txt") as f: for line in f: line=line.strip('\n') hid,uid,app=line.split(',')
以hid为中心,添加对应的uid,app节点:
G.add_edge(hid, uid) G.add_edge(hid, app)
逐行处理样本文件,获取对应的hid,uid,action字段:
with open("../data/KnowledgeGraph/sample4.txt") as f: for line in f: line=line.strip('\n') hid,uid,action=line.split(',')
以hid为中心,添加对应的uid,action节点:
G.add_edge(hid, uid) G.add_edge(hid, action)
可视化知识图谱:
nx.draw(G, with_labels=True, node_size=600) plt.show()
对应知识图谱如图13-24所示。
图13-24 疑似刷单行为知识图谱