+关注
已关注

分类  

pandas(0)

flask(0)

标签  

pandas(0)

flask(0)

日期归档  

2020-04(19)

2020-05(27)

2020-06(37)

2020-07(43)

2020-08(39)

python爬取分析超级大乐透历史开奖数据!你中奖了吗?

发布于2021-02-27 14:58     阅读(228)     评论(0)     点赞(2)     收藏(4)


0

1

2

3

4

5

6

7

爬取网站:http://datachart.500.com/dlt/history/history.shtml —500彩票网 (分析后发现网站源代码并非是通过页面跳转来查找不同的数据,故可通过F12查找network栏找到真正储存所有历史开奖结果的网页)

如图:

爬虫部分:

from bs4 import BeautifulSoup   #引用BeautifulSoup库
import requests                 #引用requests
import os                       #os
import pandas as pd
import csv
import codecs

lst=[]
url='http://datachart.500.com/dlt/history/newinc/history.php?start=07001&end=21018'
r = requests.get(url)                     
r.encoding='utf-8'
text=r.text
soup = BeautifulSoup(text, "html.parser")
tbody=soup.find('tbody',id="tdata")
tr=tbody.find_all('tr')
td=tr[0].find_all('td')
for page in range(0,14016):
    td=tr[page].find_all('td')
    
    lst.append([td[0].text,td[1].text,td[2].text,td[3].text,td[4].text,td[5].text,td[6].text,td[7].text])
    with open("Lottery_data.csv",'w') as csvfile:
        writer = csv.writer(csvfile)
        writer.writerow(['期号','号码1', '号码2', '号码3', '号码4', '号码5', '号码6', '号码7'])
        writer.writerows(lst)
csvfile.close()

数据分析: 首先展示所有的彩票期号以及相应的中奖数字

 

而后通过5+2的模式分别初步分析最高频次的两组数据组合,比较模糊的计算出了本组合中奖概率为平均中奖几率的3倍(最终结果不直接展示而是在csv文件中以红色标明)

源代码以及相应csv文件,点击下方蓝色字体即可

近期有很多朋友通过私信咨询有关Python学习问题。为便于交流,点击蓝色自己加入讨论解答资源基地


 

 

0

1

2

3

4

5

6



所属网站分类: 技术文章 > 博客

作者:爱丽丝

链接: https://www.pythonheidong.com/blog/article/860128/ba36fb5cba426758380c/

来源: python黑洞网

任何形式的转载都请注明出处,如有侵权 一经发现 必将追究其法律责任

2 0
收藏该文
已收藏

评论内容:(最多支持255个字符)