旗下导航:搜·么
当前位置:网站首页 > Python教程 > 正文

Python 爬取张国荣最火的 8 首歌,60000 批评看完泪奔!【Python教程】,Python

作者:搜教程发布时间:2019-11-27分类:Python教程浏览:28评论:0


导读:昨天是4月1日。每一年的这一天,一部分人绞尽脑汁想尽办法整蛊,一部分人感念四月该很好,倘使你还在。以至有人,用AI的体式格局来复原你。但那究竟不...
昨天是 4 月 1 日。

每一年的这一天,

一部分人绞尽脑汁想尽办法整蛊,

一部分人感念四月该很好,倘使你还在。

以至有人,用 AI 的体式格局来复原你。

但那究竟不是你啊。

图片泉源见水印

你走了 16 年了,那些当年在课桌前趁先生不注意偷偷听你歌的少年们,也许早已为人夫为人妇。

纵然如此,每一年却有很多人在这人世四月天里,借着你给天下留下的不绝覆信,去忖量你、去给你留言,纵然明显晓得,永久也不会收到复兴。

眼下,我们挑选以科技的体式格局,来留念哥哥。

我们爬取了你在网易云音乐上,批评最多的八首歌曲。

它们依次是:《缄默沉静是金》《春夏秋冬》《倩女幽魂》《当爱已成旧事》《我》《风继承吹》《玻璃之情》《风再起时》。

统共 64540 条的批评中,涌现最多的是“生日快活”、“哥哥”、“加油”、“你若尚在场”、“新年快活”和“哥哥,生日快活”。

词云图里很少有“4 月 1 日”、“愚人节”的字眼,这并非这一天去给你批评的人少,而是在这个日子,着实不适合对你说“快活”。

来,先给人人看看批评的代码。

# coding:utf-8
import json
import time
import requests
from fake_useragent import UserAgent
import random
import multiprocessing
import sys
#reload(sys)
#sys.setdefaultencoding('utf-8')

ua = UserAgent(verify_ssl=False)

song_list = [{'186453':'春夏秋冬'},{'188204':'缄默沉静是金'},{'188175':'倩女幽魂'},{'188489':'风继承吹'},{'187374':'我'},{'186760':'风雨起时'}]
headers = {
    'Origin':'https://music.163.com',
    'Referer': 'https://music.163.com/song?id=26620756',
    'Host': 'music.163.com',
    'User-Agent': ua.random
}

def get_comments(page,ite):
    # 猎取批评信息
    # """
    for key, values in ite.items():
        song_id = key
        song_name = values
    ip_list = [IP列表]
    url = 'http://music.163.com/api/v1/resource/comments/R_SO_4_'+ song_id +'?limit=20&offset=' + str(page)
    proxies = get_random_ip(ip_list)
    try:
        response = requests.get(url=url, headers=headers,proxies=proxies)
    except Exception as e:
        print (page)
        print (ite)
        return 0
    result = json.loads(response.text)
    items = result['comments']
    for item in items:
        # 用户名
        user_name = item['user']['nickname'].replace(',', ',')
        # 用户ID
        user_id = str(item['user']['userId'])
        print(user_id)
        # 批评内容
        comment = item['content'].strip().replace('\n', '').replace(',', ',')
        # 批评ID
        comment_id = str(item['commentId'])
        # 批评点赞数
        praise = str(item['likedCount'])
        # 批评时刻
        date = time.localtime(int(str(item['time'])[:10]))
        date = time.strftime("%Y-%m-%d %H:%M:%S", date)

八首歌的歌词代码:

import requests
from bs4 import BeautifulSoup
import re
import json
import time
import random
import os

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3355.4 Safari/537.36',
    'Referer': 'http://music.163.com',
    'Host': 'music.163.com'
}


# 猎取页面源码
def GetHtml(url):
    try:
        res = requests.get(url=url, headers=headers)
    except:
        return None
    return res.text


# 提取歌手歌词信息
def GetSongsInfo(url):
    print('[INFO]:Getting Songs Info...')
    html = GetHtml(url)
    soup = BeautifulSoup(html, 'lxml')
    links = soup.find('ul', class_='f-hide').find_all('a')
    if len(links) < 1:
        print('[Warning]:_GetSongsInfo <links> not find...')
    Info = {'ID': [], 'NAME': []}
    for link in links:
        SongID = link.get('href').split('=')[-1]
        SongName = link.get_text()
        Info['ID'].append(SongID)
        Info['NAME'].append(SongName)
    # print(Info)
    return Info


def GetLyrics(SongID):
    print('[INFO]:Getting %s lyric...' % SongID)
    ApiUrl = 'http://music.163.com/api/song/lyric?id={}&lv=1&kv=1&tv=-1'.format(SongID)
    html = GetHtml(ApiUrl)
    html_json = json.loads(html)
    temp = html_json['lrc']['lyric']
    rule = re.compile(r'\[.*\]')
    lyric = re.sub(rule, '', temp).strip()
    print(lyric)
    return lyric


def main():
    SingerId = input('Enter the Singer ID:')
    url = 'http://music.163.com/artist?id={}'.format(SingerId)
    # url = "http://music.163.com/artist?id=6457"
    Info = GetSongsInfo(url)
    IDs = Info['ID']
    i = 0
    for ID in IDs:
        lyric = GetLyrics(ID)
        SaveLyrics(Info['NAME'][i], lyric)
        i += 1
        time.sleep(random.random() * 3)
        # print('[INFO]:All Done...')


def SaveLyrics(SongName, lyric):
    print('[INFO]: Start to Save {}...'.format(SongName))
    if not os.path.isdir('./results'):
        os.makedirs('./results')
    with open('./results/{}.txt'.format(SongName), 'w', encoding='utf-8') as f:
        f.write(lyric)

01

《缄默沉静是金》

是错永不对 真永是真

任你怎说安守我本份

一向置信 缄默沉静是金


这首歌是你亲身谱曲的。

当时,“谭张争霸”(1986-1989 年,谭咏麟和张国荣为争取乐坛职位,而在音乐上展开了周全合作比赛)已进入白热化。

你憎恶争来争去,因而借歌明志,推出了《缄默沉静是金》。

你说,“任你怎说安守我本份,一向置信,缄默沉静是金。”

清者自清,你的缄默沉静,越发彰显单纯本性。

02

《春夏秋冬》

秋日该很好 你若尚在场

秋风纵然带凉 亦美丽

暮秋中的你填密我妄想

就像落叶飞 小扣我窗


每到你生日时、每到新年时、每到你脱离天下的那天时,你的歌下面就会有大批批评涌来。

你是 4 月 1 日走的,然则喜好你的人,老是 3 月 30 日、31 日以至更早,就来你的音乐下面批评。

若干人愿望你回生,以至有人在重庆看到一名和你眉眼很像的出租者司机,都不由得拍下。

你眼神中的澄彻和犹疑,事隔经年,照样那末让人没法遗忘。

03

《倩女幽魂》

尘世里 好梦有若干好多方向

找痴痴梦境中亲爱

路随人茫茫

《倩女幽魂》里,你是羞怯胆小的墨客,走夜路时要点三盏灯笼,但却为了郁闷阳光把小倩的灵魂照散,死死地用肩膀扛着门板。

小倩走了,宁采臣的心也随着死了。

哥哥走了,他人再演宁采臣,总觉得除却巫山不是云。

04


《当爱已成旧事》

为什么你不懂

只需有爱就有痛

有一天你会晓得

人生没有我并不会差别


《霸王别姬》里,你演程蝶衣。

演得那末娇媚,以至于有人断言你是童子功身世。

实在,你只不过是宿疾还对峙练习罢了。

你说“不疯魔,不成活”,所以你晓得段小楼授室后,会妒忌会惆怅会发疯。

戏里戏外,你都爱过,你说“只需有爱就有痛”,但却更像是唱给本身听。

你如许的地道和“认死理”,老是让粉丝很疼爱你......

05


《我》

伶仃的戈壁里 一样盛放的光秃秃

何等愉快 在琉璃屋中快活生活

对天下说 什么是灼烁和磊落

我就是我 是色彩不一样的炊火


若干人用你唱的那句“我就是我,是色彩不一样的炊火”来勉励本身活出自我。

但末了你却已炊火一样的体式格局,脱离了人世间。

几年前,梁朝伟在留念你的演唱会上,拨通你的电话。

电话里,留言声照旧,“你好,我是leslie,有事请留言。”

梁朝伟缄默沉静了,好久以后,淡淡说句:“宝荣啊,不如我们重新来过。”

06


《风继承吹》

风继承吹不忍阔别

内心亦有泪不肯堕泪望着你

过去若干快活影象

何妨与你一同去追


这是你的成名曲,所以你好像很中意它。

往往列入演唱会,都要唱一唱。

末了一次唱起时,不知怎的居然哭了,台下观众也随着你哭。

由于这首歌,是你翻身的见证啊。

你在歌坛摸爬滚打那末多年,一向寂寂无声,是这首歌才没有让你被湮没。

07


《玻璃之情》

不信眼泪 能令失踪的你爱下去

难收的覆水 将情绪漫漫荡开去

假如你太累 实时地作别没有罪


你曾说,每次唱歌前,都要给这首歌编一个故事,唱的时刻,脑海中浮现出故事的画面,而这类画面感,让你唱得很投入。

为什么你的歌经年累月,就是由于你不仅对人重情,对歌也重情。

08

《风再起时》

我转头再往某年

像失神照片乍现面前

这个茫然疑心少年

愿终身以歌 投入天天永稳定


1989 年,已见过了娱乐界太多浮沉的你,倏忽宣告离别乐坛。

你见过喧哗,但你却不属于喧哗。

谋划离别演唱会之前,你和音乐人陈少琪、黎小田探讨。

陈少琪说,“你不是有一首成名曲叫《风继承吹》么?不如歌名就叫《风再起时》,就是愿望只需一同风的时刻,歌迷就会想起你的这首歌。”

边上的黎小田,花了十五分钟就在顺手找来的白纸上,谱好了曲子。

很快,陈少琪也把词填好了。

有人说,这首歌里的歌词,就是为你量身定做的:“我转头再往某年,像失神照片乍现面前,这个茫然疑心少年,愿终身以歌,投入天天永稳定”。

愿终身以歌,投入天天永稳定......



不晓得如今的你,还唱歌吗?还演戏吗?

你知不晓得,很多人都在想你。

谢谢你,留给我们这么多歌曲和影戏。

愿你在别的一个天下,永久没有郁闷和快乐。

以上。

本篇文章到这里就已悉数完毕了,更多其他精彩内容人人能够关注ki4网的Python视频教程栏目!!!

以上就是Python 爬取张国荣最火的 8 首歌,60000 批评看完泪奔!的细致内容,更多请关注ki4网别的相干文章!

标签:Python


欢迎 发表评论: