周董新歌《说好不哭》上的线,20 w评论,歌迷都说了些啥

  

周杰伦作为天王,具有划时代的意义毋庸置疑,他的歌伴随了多少个90后的日日夜,夜是多少人的回忆和情怀!

     周董新歌《说好不哭》上的线,20 w评论,歌迷都说了些啥”>
  
  <p> 9月16日晚间,一代天王周董发布了最新单曲
  </p>
  <p>发布后,真的让一波人哭了</p>
  <p>一群想抢鲜听的小伙伴直接泪奔</p>
  <p>因为QQ音乐直接被搞崩了</p>
  <p>没想到干翻QQ音乐的不是网易云音乐</p>
  <p>也不是虾米音乐</p>
  <p>
  </p>
  <p>周董成成功地凭一己之力干翻了QQ音乐</p>
  <p>那么听过周董新歌后的小伙伴都是怎么评价的呢? </p>
  <p>这里,我们获取了QQ音乐的近20 w条评论数据进行分析</p>
  <p>看看其中有哪些有趣的东西</p>
  <h2类=      

  

  

在QQ网页版直接搜索”说好不哭”

  

很容易就能找到单曲页面

     周董新歌《说好不哭》上的线,20 w评论,歌迷都说了些啥”>
  
  <p>说好不哭</p>
  <p>拉到页面最下方</p>
  <p>可以看到评论的分页查看按钮</p>
  
  <img src=   

这里是单页评论的获取

  

所有评论的获取只需递增pagenum即可

  

  

  

返回数据中有很多暂时不需要的字段

  

这里我们只取其中的用户名,评论时间,评论内容,点赞数

  

对应如下字段

  
 {,“nick":,“丨那壹刻永遠消失\“\”,,,“praisenum":, 1,“rootcommentcontent":,“越听越好听怎么回事!“,,“time":, 1568729836,} 
  

由于数据量较大这里我们暂时将数据存放在Excel中

  

一来无须依赖外部数据库

  

二来可以使用Excel对数据进行二次处理

  

数据存储代码如下:

  
 def  file_do (list_info, file_name):, #,获取文件大小,if  not  os.path.exists (file_name):, wb =, openpyxl.Workbook (), page =, wb.active  page.title =, & # 39;杰# 39;,page.append((& # 39;昵称& # 39;,& # 39;时间& # 39;,& # 39;点赞数& # 39;,& # 39;评论& # 39;]),其他:,wb =, openpyxl.load_workbook (file_name), page =, wb.active  for  info  list_info:拷贝,试题:,page.append(信息),except 例外:,打印(信息),wb.save(文件名=file_name) 
        

  

  

首先我们对评论按小时区间进行汇总

  

由于时间粒度比较小,这里对时间粒度进行了一些处理

     周董新歌《说好不哭》上的线,20 w评论,歌迷都说了些啥”>
  
  <p>评价人数走势图</p>
  <p>周董的新曲是在9.16号23点准时发布的</p>
  <p>可以看出在发布后的一个小时内(23:00-24:00)<h2 class=周董新歌《说好不哭》上的线,20 w评论,歌迷都说了些啥