菜单 学习猿地 - LMONKEY

VIP

开通学习猿地VIP

尊享10项VIP特权 持续新增

知识通关挑战

打卡带练!告别无效练习

接私单赚外块

VIP优先接,累计金额超百万

学习猿地私房课免费学

大厂实战课仅对VIP开放

你的一对一导师

每月可免费咨询大牛30次

领取更多软件工程师实用特权

入驻
215
0

日报3.3

原创
05/13 14:22
阅读数 41404

今天爬取详细信息准备从详细信息中提取地址信息,药品的详细信息就存放在一个table表格中当爬取整个表格的时候只爬取第一个td中的标题信息,而第二列中td还包含一个span标签,其中的内容没有爬取到

直接爬取

    for tr in trs:
        ui = []
        for td in tr:
            ui.append(td.string)
        ulist.append(ui)

 

 

 经过修改爬取

    for tr in trs:

        for td in tr:

            #print(td.string)
            #print (td)
            if td.string == "药材名称":
                spans = tr.find('span')#获取span标签中的数据

                #ui.append(td.string)
               
                ulist.append(spans)
        #ulist.append(ui)

修改后

 

 标签中还是存在一些杂乱信息,还需要用正则进行处理

发表评论

0/200
215 点赞
0 评论
收藏
为你推荐 换一批