腾讯视频去广告实践-猿圈-程序猿的知识社区

闲话不表，去除腾讯视频广告步骤：

通过请求某个视频在浏览器中的地址，分析页面返回，获取视频的vid
拼接接口地址，请求tx的某接口，获取视频的真实地址
通过selinum的webdriver，向chrome 传入真实的视频地址

下面分别通过python实现这三个步骤的

首先，定义一个qq视频处理对象，此文件命名为 txvideo.py，导入相关包

import time  
import re  
import json  
from urllib import request  
from selenium import webdriver  
  
class TxVideo:  
    def __init__(self, burl):  
        self.qqurl = burl  
        #保存可能的异常信息
        self.error = []

step1：

获取视频的vid，就是通过正则找到一个href 链接，得到链接尾部的一个值，即 vid, 实际上就是获取html 页面的这一行：
<link rel="canonical" href="https://v.qq.com/x/cover/mzc00200v8raugd/u00339s31q1.html" /> 中的 u00339s31q1

def _get_vid2(self):  
    '''通过urllib分析vids，可免于上一方法中打开页面还是播放广告'''  
  headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'}  
    req = request.Request(self.qqurl, headers\=headers)  
    html = request.urlopen(req).read().decode('utf-8')  
    #with open("video.html", 'w', encoding='utf-8') as f:  
 #    f.write(html)  match = re.search(r'canonical.\*?(\w+)\.html', html)  
    return match.group(1)

注意需要设置 http header 的user-agent, 可以替换为你自身浏览器的头。

step2

def _get_keys(self, vid):  
  jurl = 'http://vv.video.qq.com/getinfo?vids={0}&platform=101001&charge=0&otype=json'.format(vid)  
  
 # 返回的内容并不是json,而是 QZOutputJson={xxx} # 去掉头部的xx= 和尾巴上的 ; 
  jdata = json.loads(content[13:len(content)-1])  
    #这个json的层次很深，还不如直接用正则匹配  
  p = jdata['vl']['vi'][0]  
  urls = p['ul']['ui']  
    #找到其中链接为 vlive.qqvideo  qqvideo = None  
  for item in urls:  
        if item["url"].find('vlive.qqvideo')>0 or item["url"].find('video.dispatch')>0:  
            qqvideo = item["url"]  
            break  
  
 if qqvideo is None:  
        self.error.append('未找到qqvideo相关链接，可尝试其它链接')  
        return None  
  return qqvideo, p["fn"], p["fvkey"]

step3

视频类的主入口，如果传入了的bopen 参数为 True 则打开chrome,直接播放

def getTrueMedia(self, bopen):  
    vid = self._get_vid2()  
    print("vid:", vid)  
    if vid is None:  
        return  
  keys = self._get_keys(vid)  
  #print("keys:", keys)  
  if len(keys) != 3:  
        self.error.append('分析JSON数据失败')  
        return  
  turl = '{0}{1}?vkey={2}'.format(keys[0], keys[1], keys[2])  
  
  if bopen:  
        self.driver = webdriver.Chrome('./lib/chromedriver.exe')  
        self.driver.get(turl)  
  
   return turl

使用方法：

通过在控制台传入视频地址，如下所示：
python view.py https://v.qq.com/x/cover/mzc0...

view.py 入口文件，接受控制台参数，简单如下

import sys  
from txvideo import TxVideo  
  
def main():  
    if len(sys.argv) == 1:  
        print("请输入tx视频网页地址")  
        return  
  
  txv = TxVideo(sys.argv[1])  
    #分析真实的url,并打开页面播放  
  txv.getTrueMedia(True)  
    errors = txv.geterror()  
    if errors is not None:  
        print(errors)  
  
  
if __name__ == '__main__':  
    main()

后记：

以上代码逻辑比较简单的，核心在于分析真实地址的流程，比较费劲，这里参考的是网上分析结果，如果tx的开发人员稍作改动，以上代码就会失效，截至到 2020.1.4 还可以。
另外在将代码从 pycharm 复制到此编辑器时，总是会增加如还有多余的请自行清除

参考：https://mp.weixin.qq.com/s/ea...

菜单 学习猿地 - LMONKEY

开通学习猿地VIP

尊享10项VIP特权 持续新增

知识通关挑战

打卡带练！告别无效练习

接私单赚外块

VIP优先接，累计金额超百万

学习猿地私房课免费学

大厂实战课仅对VIP开放

你的一对一导师

每月可免费咨询大牛30次

领取更多软件工程师实用特权

Java开发工程师

何以解忧，唯有 Java！

Python开发工程师

人生苦短我要学Python！

PHP开发工程师

PHP是世界上最好的编程语言!

GO开发工程师

想优雅的写程序，赶紧GO!

大数据开发工程师

弄大数据，就是在搞革命!

前端开发工程师

不仅最好，而且最全!

UI开发工程师

这个世界从来不缺少美，缺少你来创造美!

Linux运维工程师

不只是说说而已！

WEB前端1+X

不仅为考证，轻松做开发

计算机二级（C语言）

一切只为考证！

猿工手册

各种工具精挑细选

猿材料

各种工具精挑细选

猿代码

各种工具精挑细选

猿著课件

各种工具精挑细选

知识题库

知识闯关节节高，刷题涨知识！

阶段练习

单元测试知识学习状况秒掌握！

期末考试

期末测试，学习情况即刻知道！

面试题库

最新的企业技术人员招聘真题练习！

Java专区

2948篇 ｜ 24.5万人浏览

Python专区

2593篇 ｜ 19.5万人浏览

大数据专区

2948篇 ｜ 18.5万人浏览

PHP专区

3953篇 ｜ 27.5万人浏览

Go专区

1382篇 ｜ 12.5万人浏览

Web前端专区

1453篇 ｜ 31.5万人浏览

Linux云计算

1230篇 ｜ 4.5万人浏览

其他专区

53232篇文章 ｜ 11.5万人浏览

搜索

历史记录 清除记录

近期热搜

项目开发全程实录（电商EW_Shop）

8675 人 1年前

轻松学会Laravel-项目篇（商城API）

2022 人 1年前

Python数据分析2.0-金融

325 人 1年前

Python办公自动化2.0

241 人 1年前

使用账号登录

启用更安全省心的  微信登录

Java开发工程师

何以解忧，唯有 Java！

Python开发工程师

菜单学习猿地 - LMONKEY

尊享10项VIP特权持续新增

2948篇｜ 24.5万人浏览

2593篇｜ 19.5万人浏览

2948篇｜ 18.5万人浏览

3953篇｜ 27.5万人浏览

1382篇｜ 12.5万人浏览

1453篇｜ 31.5万人浏览

1230篇｜ 4.5万人浏览

53232篇文章｜ 11.5万人浏览

历史记录清除记录

2948篇｜ 24.5万人浏览

2593篇｜ 19.5万人浏览

2948篇｜ 18.5万人浏览

3953篇｜ 27.5万人浏览

1382篇｜ 12.5万人浏览

1453篇｜ 31.5万人浏览

1230篇｜ 4.5万人浏览

53232篇文章｜ 11.5万人浏览