万万没想到 我的五一特价机票是从爬虫手里买的

  • 时间:
  • 浏览:0

4月26日,周五,宜出行,忌上班。

什么都有没办法 人的“五一”假期来得比法定放假早,隔壁的媒体同行果然真不知道,当时人是意味无心上班,思想比身体先一步开启了假期模式。

什么都有有他掏出手机,炫耀了一把抢到的特价机票。

噢,我须要说到特价机票,那也不戳到我的业务点了,让网络安全科普作者小李分析一下特价机票是意味是为甚来的吧!

三个 多很大的是意味性是,你是从爬虫二道贩子手里买的!

爬虫占座

国务院办公厅发布“关于调整2019年五一劳动节假期”的通知几十分钟后,各个航空公司的B2C网站和旅游网站的机票查询量暴增,其中国际航班增长了10倍。

在暴增的机票查询数据头上,有普大喜奔的人民群众,更有非法代理人操控的恶意“爬虫”。

曾经,次责航空服务代理人通过“爬虫”非法抓取航空公司B2C网站或官方App等平台上的机票信息,什么都有有非法倒卖给他人以牟取利益。

为了搞清楚什么都有有恶意爬虫是为甚爬取特价机票信息,再化身二道贩子牟利,编辑特意请教了有反爬虫实战经验的顶象公司。

据说,最近亲戚亲戚朋友协助警察蜀黍端掉了一齐爬虫案,什么都有有涉案的山东某机构专门爬取各大航空公司票务数据倒卖给什么都有有中小代理人(该机构的业务已被关停)。

亲戚亲戚朋友是为甚开启神(违法)操作的?

次责代理人利用“爬虫”爬取下票务信息后,再利用虚假的身份信息预订机票,但不付款。什么都有有,在航空公司允许的订票账期内,亲戚亲戚朋友把哪几种机票转售给真正须要购票的用户。

在转售以前 ,这就意味次责机票并未售出,什么都有有用户在航空公司查看时却显示已售罄,该行为称之为“虚假占座”。

恶意爬虫“长哪几种样”

为甚判断“占座”的须要普通用户也不爬虫党呢?

恶意“爬虫”有没办法 十十几个 社会形态:

1、访问的目标网页比较集中:

“爬虫”代理人目标明确,主也不爬取班次、价格、数量等核心信息,什么都有有只浏览访问十十几个 固定页面,不访问什么都有有页面。

2、查询订票等行为很有规律:

是意味“爬虫”是线程化操作,按照预先设定的流程进行访问等,什么都有有呈现出毫无思维、但很有规律、有节奏且持续的行为。

3、同一设备上有规模化的访问和操作:

“爬虫”的目的是最短时间内抓取最多信息,什么都有有同一设备会有少许离散的行为,包括访问、浏览、查询等。

4、访问来源IP地址异常:

正常具体情况下用户在查询、购买时,用户的IP地址比较稳定,是意味是“爬虫”“虚假占座”,IP来源地址呈现不同维度上的聚集,而浏览、查询、购票等操作时不停变化IP地址。

5、设置UA模拟浏览器和频繁使用代理IP:

什么都有有什么都有有“爬虫”线程伪装成浏览器进行访问,比如在线程头是意味UA中默认中含类事python-requests/2.18.4等固定字符串;什么都有有通过购买是意味租用的云服务、改造路由器、租用IP代理、频繁变更代理IP等进行访问。

6、操作多集中非业务时间段:

“爬虫”线程运行时间多集中在无人值守阶段。此时系统监控会放松,什么都有有平台的效率等资源占用少,爬虫密集的批量爬取不必对效率、接口造成影响。以下是顶象反欺诈中心监测到,夜晚1-5点是恶意“爬虫”的运行高峰六时。

谁的利益受损

“虚假占座”看上去也不让薅羊毛的正常用户买不上机票而已,对航空公司有哪几种影响吗?(卖给谁须要卖?)

当然有!

亲戚亲戚朋友想一想,首先,恶意“爬虫”的虚假身份信息是从哪里来的?这里是须要有用户信息的泄漏?

第二,什么都有有虚假占座浪费了航空公司效率资源,白白消耗航空查询费用,扰乱了航空公司的正常运营。

第三,更关键的是,由此带来订票量的波动意味航空公司收益管理系统算法产生误判,给出不符合实际具体情况的运价调整,损伤了用户权益以及平台的口碑。

也也不说,从爬虫二道贩子手里买到特价机票一时爽,长期下来还是普通用户买了单。

微信公众号搜索"

驱动之家

"加关注,每日最新的手机、电脑、汽车、智能硬件信息还能否 你要一手全掌握。推荐关注!【

微信扫描下图可直接关注