11.8亿条!淘宝遭遇爬虫数据泄露大案:客户ID、淘宝昵称、手机号全都有…

ICT销售与大客户联盟 2021-08-11

文章来源:中国基金报

你有收到过加微信送礼品,或者邀请刷单的信息吗?如果有,那么你的个人信息可能遭到了泄露……

近日,商丘市睢阳区人民法院在裁判文书网,公开了一份刑事判决书,显示一名住在河南商丘市的本科毕业的大学生逯某自2019年11月起,对淘宝实施了长达八个月的数据爬取并盗走大量用户数据。在阿里巴巴注意到这一问题前,已经有超过11亿8千多万条用户信息泄露。

到底发生了什么?

两个相隔千里的人,是如何一起合作做下这起惊天大案的呢?

被告人逯某供述称,2017年7月在QQ群里认识了黎某,黎某当时在做“淘宝客”需要一些“淘宝客”软件,其为黎某编了个“微信加人”软件,没收钱,黎某承诺说算其技术入股,等以后成立公司了再与我算钱。

2019年3月份黎某成立了一家名为“浏阳市泰创网络科技”的公司,逯某成为该公司技术员,一直在家远程办公,并领取每月1万元的报酬。

2019年11月份,逯某开始用自己开发的爬虫软件“淘评评”,通过淘宝商品详细信息接口和淘宝信息分享接口,爬取淘宝客户的淘宝数字ID和淘宝昵称,并通过淘宝分享接口可以爬取淘宝客户手机号信息。

其中,爬取的客户的手机号码信息,逯某都提供给黎某了,爬取的淘宝客户ID和淘宝昵称,逯某则存在了自己的电脑硬盘里,没有提供给黎某和外泄。

而黎某,则在收到淘宝客户手机号码之后会把这些信息数据导入“微信加人”软件,加微信好友成功后,拉入建好的微信群,由公司里的员工负责发送广告链接。淘宝用户在该公司的微信群里购买商品之后,该公司将获得佣金。

就这样神不知鬼不觉地进行了8个多月,逯某前前后后爬取了5000多万条信息,并从其他地方下载了11亿多条数据。直到2020年8月14日淘宝(中国)软件有限公司报警称,在2020年7月6日到2020年7月13日时,有黑产人员通过接口,绕过平台风控,批量爬取数据。在7月6日至7月13日之间,平均每天爬取数量500万,爬取内容包括买家用户昵称,用户评价内容,昵称等敏感信息。

最终,逯某和黎某被河南警方逮捕。经过公检方面核查,逯某电脑里通过其开发的软件爬取淘宝客户的数字ID、淘宝昵称、手机号码等淘宝客户信息共计1180738048条

值得注意得是,被告人逯某表示,这11.8亿的数据通过微信文件的形式发给黎某之后,黎某会转一笔费用给他,整个获利只有六七万或七八万元。

涉及恶意爬取淘宝数据

淘宝联盟曾点名43款违规APP

这并不是淘宝第一次被恶意地爬取淘宝数据。

2019年5月,阿里妈妈在进行违规排查过程中,发现部分淘宝客在无线APP端未经授权爬取淘宝购物车、收藏夹等并恶性宣传做淘宝客推广的行为。这一行为严重违反《淘宝客应用开发者规范》第九条:开发者不得以任何形式爬取任何淘宝数据;违反《阿里妈妈推广者规范》第八条,存在流量劫持的违规行为。

此次专项治理共发现粉象生活、省钱快报、羊毛省钱、返钱宝宝、喵喵折、叮当叮当等此类违规APP共43个。

事实上,不仅淘宝出现这类情况,在2013年时,京东也发生过类似案件。数据外泄包括密码、手机号码、电子邮件地址、用户名。

今年4月,Facebook指责“恶意行为者”泄露了超过5.3亿用户的姓名和电话号码等数据。

第三方大数据公司“人人自危”

众所周知,网络爬虫技术原本是指平台按照一定规则,自动从互联网上提取网络信息的程序或脚本,本为互联网行业的常用技术之一。爬虫技术被广泛应用到各个领域,在大数据分析、舆情检测等,在法律上从未被明令禁止。

但是数据来源合法是网络爬虫活动合法的前提。如未依据《网络安全法》第四十一条取得被收集者同意即自动抓取个人信息,技术使用者即涉嫌构成侵犯公民个人信息罪、非法侵入计算机信息系统罪或非法获取计算机信息系统数据罪等相关罪名。

在2019年,多家第三方大数据公司被纳入调查行列,原因就是因为使用爬虫技术非法获取、存储公民个人信息。

其中最有名的当属魔蝎科技。2019年9月6日,多位业内人士称,魔蝎科技疑似被相关执法人员控制,其中一位周姓核心高管人员被警方带走。

2021年1月14日,杭州西湖区人民法院对魔蝎科侵犯公民个人信息案进行一审宣判。法院认为魔蝎科技以其他方法非法获取公民个人信息,情节特别严重,其行为已构成侵犯公民个人信息罪。

法院判决,魔蝎科技犯侵犯公民个人信息罪,判处罚金人民币3000万元;法定代表人、总经理周某犯侵犯公民个人信息罪,判处有期徒刑三年,缓刑四年,并处罚金人民币50万元;技术总监袁某犯侵犯公民个人信息罪,判处有期徒刑三年,缓刑三年,并处罚金人民币30万元。

法院审理查明,魔蝎科技会将其开发的前端插件嵌入网贷平台App中。网贷平台用户使用网贷平台的App借款时,需要在魔蝎科技提供的前端插件上输入其通讯运营商、社保、公积金、淘宝、京东、学信网、征信中心等网站的账号、密码。经过用户授权后,魔蝎科技的爬虫程序即代替用户进入其个人账户,利用各类爬虫技术,爬取(复制)上述企、事业单位网站上贷款用户本人账户内的通话记录、社保、公积金等各类数据,并按与用户的约定提供给网贷平台用于判断用户的资信情况,并从网贷平台获取每笔0.1元至0.3元不等的费用。

尽管魔蝎科技在和个人贷款用户签订的《数据采集服务协议》中明确告知,“不会保存用户账号密码,仅在用户每次单独授权的情况下采集信息”,但其仍在服务器上采用技术手段长期保存用户各类账号和密码。截至2019年9月案发时,以明文形式非法保存的个人贷款用户各类账号和密码条数多达2000万余条。

根据两高《关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》,非法获取、出售或者提供行踪轨迹信息、通信内容、征信信息、财产信息50条以上即可入罪。

2019年9月前后,多家数据公司接连被查,除魔蝎科技外,还包括聚信立、新颜科技、公信宝、同盾等。

于是,在业界慢慢就出现了一句顺口溜:“爬虫玩得好,监狱进得早。数据玩得溜,牢饭吃个够。”

天网恢恢,疏而不漏。正如上述案件中,虽然逯某辩称,其只将其中一部分手机号提供给黎某用于公司经营活动,其在共同犯罪中并不起次要或辅助作用,不属从犯。

但是法院仍然认为,被告人逯某受雇于被告人黎某,二人违反国家规定,非法获取公民个人信息,情节特别严重,其行为均已构成侵犯公民个人信息罪。公诉机关指控罪名成立,且系共同犯罪。

因此,判决被告人黎某犯侵犯公民个人信息罪,判处有期徒刑三年六个月,并处罚金人民币三十五万元;被告人逯某犯侵犯公民个人信息罪,判处有期徒刑三年三个月,并处罚金人民币十万元。

华云数创自适应数据安全运营平台,用于帮助客户保护自己组织内的敏感数据或核心数据资产。对组织内的客户信息、财务数据、知识产权、业务数据等进行智能分类分级及风险评估,并结合用户行为分析智能地采取细粒度、自适应的保护措施。

系统为客户提供数据资产分类分级、数据资产风险分析、终端数据资产监控与保护、用户异常行为分析、电子文档追踪溯源、电子文档加密、业务系统监控保护、电子文档授权流转、外发文档安全管控等核心功能。为客户敏感数据资产提供智能的、自适应的全生命周期保护。

目前,该方案被广泛应用于金融、军工、科研机构、生产制造型企业等。

深圳SEO优化公司肇庆优化网站排名贵溪优化网站东莞网站seo优化多少钱百科网站优化营销算法优化平台网站网站优化公司哪家信誉好东莞百度seo网站优化射阳网站搜索优化方案玄武区手机网站优化是什么鹤壁淇滨区网站优化石家庄外贸网站建设优化江苏电商网站设计优化价格湘潭网站优化外包推荐鄢陵正规网站优化产品介绍怎么优化网站单页面网站内部优化规定彭泽网站优化推广桐梓县分类网站优化平顶山百度网站优化怎么选长宁区公司网站优化公司长宁区官方网站优化费用如何优化一个网站排行河北网站优化托管运营洛阳网站seo优化服务巩义网站自然优化哪家价格便宜医疗网站优化演示方案河南卫浴行业网站优化推广有用吗东莞网站优化关键词推广汕头个人网站优化西安网站如何优化能上首页歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化