当前位置:首页 > 网站建设 > 正文内容

htmldiv全屏代码(html5 全屏)

网站建设8个月前 (02-12)319

本文用Python从捞月狗网站上面抓取国服各区及外服王者数据信息,然后用R软件进行数据初探及浅析。旨在发现数据后面的有趣的东西!爱生活,爱数据!

分享前还是先分享自己的Python学习交流群:308754087群内不定时分享干货,包括2017最新的python企业案例学习资料和零基础入门教程,欢迎初学和进阶中的小伙伴入群学习交流

Python爬取捞月狗数据

要抓取的数据如下图所示:

主要包括王者游戏ID,所在区服,胜点,胜场,负场,胜率,最近状态,擅长位置,本命英雄等。由于捞月狗的数据是每天更新的,所以不同时间爬取数据可能会有所不同。

所用的Python代码如下:

导入所需要的模块:

import requests

import re

import pandas as pd

设置头部信息:

head={'User-Agent':'你自己的头部信息'}

设置正则来获取国服王者信息:

rem=re.compile(r'class="subStrTitle"(.*?)/span.*?server"(.*?)/div.*?class="icon-dan"em(.*?)/em.*?span(.*?)em class="color-win"(.*?).*?\tspan//span.*?span(.*?)em class="color-defeat"(.*?)/em.*?"percentage"(.*?)/span.*?/score/(.*?).png.*?color-zhongdan"(.*?)/span.*?alt="(.*?)"/.*?alt="(.*?)"/.*?alt="(.*?)"/',re.S)

展开全文

外服正则用于获取外服王者信息:

reh=re.compile(r'span class="subStrTitle"(.*?)/span.*?player-server"(.*?)/div.*?em(.*?)/em.*?span(.*?)em.*?win"(.*?)/em/span.*?span.*?span(.*?)em.*?feat"(.*?)/em.*?"percentage"(.*?)/span.*?score/(.*?).png.*?"color-zhongdan"(.*?)/span.*?src="(.*?)".*?src="(.*?)".*?src="(.*?)"',re.S)

获取国服对应的战区,存放在zhanqu_list_cn中:

url_cn='http://www.laoyuegou.com/x/zh-cn/lol/lol/godrank.html?region=cnarea=1'

html_cn = requests.get(url_cn,headers = head)

reg=re.compile(r'class="cn-li.*?href="(.*?)"',re.S)

zhanqu_list_cn=re.findall(reg,html_cn.text)#国服战区

获取外服对应的战区,存放在zhanqu_list_en中:

url_en='http://www.laoyuegou.com/x/zh-cn/lol/lol/godrank.html?region=foreignarea=kr'

html_en = requests.get(url_en,headers = head)

ren=re.compile(r'class=" foreign-li.*?href="(.*?)"',re.S)

zhanqu_list_en=re.findall(ren,html_en.text)

定义下载中国战区数据的函数:

def updown_cn(zhanqu_list_cn):

for zhanqu in zhanqu_list_cn:

for m in range(1,11):

url=zhanqu+'page='+str(m)

im = requests.get(url,headers = head)

if im.status_code == 200:

data=re.findall(rem,im.text) #得到数据rem代表国服数据

data=pd.DataFrame(data)

data.to_csv('/home/wajuejiprince/文档/LOLDT/LOLDT.csv', header=False, index=False,mode='a+')#写入csv文件,'a+'是追加模式

data=[]

定义下载外服战区数据的函数:

def updown_en(zhanqu_list_en):

for zhanqu in zhanqu_list_en:

for m in range(1,11):

url=zhanqu+'page='+str(m)

im = requests.get(url,headers = head)

if im.status_code == 200:

data=re.findall(reh,im.text) #得到数据reh代表外服数据

data=pd.DataFrame(data)

data.to_csv('/home/wajuejiprince/文档/LOLDT/LOLDT.csv', header=False, index=False,mode='a+')#写入csv文件,'a+'是追加模式

data=[]

下载数据:

updown_cn(zhanqu_list_cn) #下载中国战区数据

updown_en(zhanqu_list_en) #下载外服战区数据

下载下来的数据保存格式是CSV格式,内容如下图所示:

经过翻看数据,只找到几条格式异常数据(已经手动删除)。

R语言数据初探

下面用R软件来分析数据,看看能否发现一些有趣的事情!

导入分析是要用的R语言程序包:

library(data.table)

library(plotly)

library(magrittr)

library(wordcloud2)

导入数据:

dt=fread(file.choose())

国服数据:

dt_cn=dt[1:2500] #也就是前2500个

外服数据:

dt_en=dt[2501:4480]

各个战区王者数量(国服):

dt_cn[,.(.N),by=.(所在战区)]

所在战区 N

1: 艾欧尼亚 90

2: 祖安 80

3: 诺克萨斯 80

4: 班德尔城 90

5: 皮尔特沃夫 90

...................

25: 扭曲丛林 99

26: 教育网专区 25

27: 巨龙之巢 90

28: 男爵领域 90

29: 峡谷之巅 80

所在战区 N

概览数据(国服):

summary(dt_cn[,.(.N),by=.(所在战区)])

所在战区 N

Length:29 Min. : 25.00

Class :character 1st Qu.: 80.00

Mode :character Median : 90.00

Mean : 86.21

3rd Qu.: 90.00

Max. :100.00

#王者最少的区

dt_cn[,.(.N),by=.(所在战区)][N==25]

所在战区 N

1: 教育网专区 25

#王者有100人的区(最多也就100人)

dt_cn[,.(.N),by=.(所在战区)][N==100]

所在战区 N

1: 均衡教派 100

2: 守望之海 100

外服王者数量:

plot_ly(dt_en[,.(.N),by=.(所在战区)],x=~所在战区,y=~N,type="bar")

外服王者数量较多(相对于国服一个区),可能原因是有的外服就一个服务器,比如韩国,另外也和捞月狗统计的数据有关.

国服各区平均胜点:

dt_cn[,.(mean=mean(胜点)),by=.(所在战区)]

这里并不能看出艾欧尼亚是最强的战区。

王者平常都是处于什么游戏状态:

wordcloud2(dt_cn[,.(.N),by=.(最近状态)])

英雄联盟的评价等级是这样递增的D-,D,D+;C-,C,C+;B-,B,B+;A-,A,A+;S-,S,S+!大部分王者的最近状态往往都是S级别的状态。可惜的是该数据集中没有其他段位的数据,如果有的话还可以比较一下各个段位玩家的平时的游戏状态。

王者擅长的位置:

各个大区的王者比较喜欢打野和上单的位置。这两个位置也是英雄联盟中承受伤害比较多的位置,也可以说他们可能更倾向于玩"肉"一点的英雄吧。这样的英雄也是在职业联赛中经常说的容错率比较高。换句话说也就是:又肉又有输出型的英雄。

王者玩家本命英雄(当前版本2017.08.05):

#由于在爬去数据的时候有的本命英雄不是我们预想的,在这里将其删除(也就3~4个).

htmldiv全屏代码(html5 全屏)

dt_all=fread(file.choose())

dt_cn-dt_all[1:2497]

dt_1-dt_cn[,本命英雄1]

dt_2-dt_cn[,本命英雄2]

dt_3-dt_cn[,本命英雄3]

all_hero-c(dt_1,dt_2,dt_3) #所有的英雄

table(all_hero)%%data.frame()%%wordcloud2(shape='star')

#以星型方式绘制云图。

不愧是王者玩家,玩盲僧这样”骚气“操作的英雄。。。。。。(由于外服的本命英雄在爬取的时候爬到的都是一些图片链接,不方便可视化,所以以上云图不含外服数据)

总结:

朋友们听我一句劝,放下游戏吧, 出去走走, 读几页自己喜欢的书,去自己喜欢的地方走走,陪陪喜欢的人,晚上无聊的时候 约几个朋友出去喝喝茶,聊聊天, 真的一天下来,你会发现还是玩游戏有意思!

关于作者:

姓名:麦艳涛网名:挖掘机小王子个人网站:挖掘机小王子微信:Gorgon---MedusaQQ邮箱:WaJueJiPrince@qq.com个人简介:数据分析爱好者

扫描二维码推送至手机访问。

版权声明:本文由飞速云SEO网络优化推广发布,如需转载请注明出处。

本文链接:http://chlfg.com/post/87646.html

分享给朋友:

“htmldiv全屏代码(html5 全屏)” 的相关文章

关于网站排名优化软件的信息

关于网站排名优化软件的信息

本篇文章给大家谈谈网站排名优化软件,以及对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。 本文目录一览: 1、网站优化排名软件 2、网站如何优化排名软件 3、有哪些常用的seo排名软件? 4、网站排名优化软件有哪些 5、seo排名优化工具推荐 网站优化排名软件 网站优化排名软...

免费音效素材网站在线使用(免费的音效素材网站有哪些)

免费音效素材网站在线使用(免费的音效素材网站有哪些)

本篇文章给大家谈谈免费音效素材网站在线使用,以及免费的音效素材网站有哪些对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。 本文目录一览: 1、有没有哪种专门的音效素材下载的网站啊? 2、推荐几个免费音乐素材很多很全可以下载的网站 3、有没有不错的音效素材网站可以推荐一下? 有没有哪种...

手机浏览器怎么查看网页源代码(手机浏览器怎么查看网页源代码数据)

手机浏览器怎么查看网页源代码(手机浏览器怎么查看网页源代码数据)

本篇文章给大家谈谈手机浏览器怎么查看网页源代码,以及手机浏览器怎么查看网页源代码数据对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。 本文目录一览: 1、怎么用手机浏览器查看网页源码 2、怎样查看网页源代码 3、手机上如何查看网页代码 4、网页如何查看源代码 5、苹果手机怎么能...

情感书单图片(情感书单图片空白)

情感书单图片(情感书单图片空白)

今天给各位分享情感书单图片的知识,其中也会对情感书单图片空白进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!本文目录一览: 1、表达强烈爱国情感的书籍有哪些? 2、书单怎么制作 3、女生看哪些书籍可以摆脱情感烦恼,治愈内心? 4、抖音里的全民任务中,情感书单又是那一...

su素材库免费下载(su素材百度云)

su素材库免费下载(su素材百度云)

今天给各位分享su素材库免费下载的知识,其中也会对su素材百度云进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!本文目录一览: 1、能发个SU常用插件以及素材么,和建筑有关的,或者下载的链接也行,在下面,提问不让留,,, 2、求一个素材网站,主要是平面设计素材,如PSD、C...

word文档怎么打印A3书籍折页(如何打印a3书籍折页)

word文档怎么打印A3书籍折页(如何打印a3书籍折页)

今天给各位分享word文档怎么打印A3书籍折页的知识,其中也会对如何打印a3书籍折页进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!本文目录一览: 1、请问Word文档页面设置里如何将A3纸张设置成2张A4并列的版式打印出来? 2、word怎么样设置a3书籍折页 3、A...