博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
在CentOS下利用Python+selenium获取腾讯首页的今日话题。
阅读量:6833 次
发布时间:2019-06-26

本文共 1480 字,大约阅读时间需要 4 分钟。

1、安装依赖包

yum install wget firefox gcc zlib zlib-devel Xvfb

2、安装setuptools

官网地址:https://pypi.python.org/pypi/setuptools

百度地址:http://pan.baidu.com/s/1i5JlRH7

tar zxvf setuptools-31.0.0.tar.gzcd setuptools-31.0.0python setup.py install

3、安装selenium

官网地址:https://pypi.python.org/pypi/selenium#downloads

百度地址:http://pan.baidu.com/s/1miJfI7A

tar zxvf selenium-3.0.2.tar.gzcd selenium-3.0.2python setup.py install

4、安装PyVirtualDisplay

官网地址:https://pypi.python.org/pypi/PyVirtualDisplay

百度地址:http://pan.baidu.com/s/1gf2uUBL

tar zxvf PyVirtualDisplay-0.2.1.tar.gzcd PyVirtualDisplay-0.2.1python setup.py install

注意:如果提示EasyProcess相关的错误 ,请先安装EasyProcess再安装PyVirtualDisplay。

EasyProcess下载地址:https://pypi.python.org/pypi/EasyProcess    安装方法和PyVirtualDisplay一样

由于我的CentOS是没有界面的,所以需要安装PyVirtualDisplay来模拟。

5、安装geckodriver

官网地址:https://github.com/mozilla/geckodriver/releases

百度地址:http://pan.baidu.com/s/1i54YH5z

tar zxvf geckodriver-v0.11.1-linux64.tar.gzmv geckodriver /usr/local/bin

6、Python代码 

# -*- coding: utf-8 -*-  from selenium import webdriverfrom pyvirtualdisplay import Displaydisplay = Display(visible=0, size=(800,600))  display.start()  dr = webdriver.Firefox()dr.get('http://www.qq.com/')url = dr.find_element_by_css_selector('#todaytop a').get_attribute('href')dr.get(url)#获取标题title = dr.find_element_by_id('sharetitle').textprint(title)#获取内容content = dr.find_element_by_id('articleContent').get_attribute('innerHTML')print(content)dr.quit()

执行效果:

其他资料

 selenium-webdriver+python基本操作:

转载地址:http://lajkl.baihongyu.com/

你可能感兴趣的文章
你所要知道的所有关于Angular的变化检测机制
查看>>
GIT入门
查看>>
从零构建一个基于Docker的Laravel应用
查看>>
【332天】每日项目总结系列070(2018.01.03)
查看>>
java源码
查看>>
Container With Most Water -- leetcode
查看>>
Canvas保存图片到七牛云
查看>>
Vue数组的动态响应
查看>>
Node.js源码解析-HTTP请求响应过程
查看>>
preventDefault()、stopPropagation()、return false 之间的区别
查看>>
缓存的Cache Aside模式
查看>>
Node.js中流的使用
查看>>
ES6 常用新特性讲解
查看>>
关于直播几个视频格式的概念总结
查看>>
CentOS 7下安装Tomcat到服务
查看>>
[wireshark]实用技巧整理收集
查看>>
Es6 写的文件import 起来解决方案详解
查看>>
[译] ConstraintLayout基础系列之参照线guidelines
查看>>
JS中可能用得到的全部的排序算法
查看>>
actor ceo ex3ndr 介绍的actor,java,gwt,j2obj的框架体系
查看>>