博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
简单易用的headless浏览器
阅读量:7067 次
发布时间:2019-06-28

本文共 606 字,大约阅读时间需要 2 分钟。

源码没有看,应该是用python封装了pyqtwebkit。

需要安装pyqt4(sudo apt-get install python-qt4)

简单示例

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
from 
ghost 
import 
Ghost
import 
time
def 
main():
    
ghost 
= 
Ghost()
    
start 
= 
time.time()
    
page, resources 
= 
ghost.
open
(
"http://www.baidu.com/"
)
    
end 
= 
time.time()
    
#保存了所有的资源,包括js
    
for 
res 
in 
resources:
        
print 
res.url, res.http_status
    
print 
ghost.content 
#输出内容
    
ghost.capture_to(
'/home/chenjianshu/tmp/header.png'
#截图
    
print 
end
-
start
                                                  
                                                  
main()

其它功能官网上都有写,功能不多,但简单够用。性能一般,毕竟是完整浏览器,不能要求太多。page返回是None比较奇怪,得有空看下源码。

本文转自 dogegg250 51CTO博客,原文链接:http://blog.51cto.com/jianshusoft/1315870,如需转载请自行联系原作者

你可能感兴趣的文章
jdbc 获取connection 对象的三种方式
查看>>
jsp标签+jstl
查看>>
第二阶段个人总结09
查看>>
FATAL ERROR: Could not find ./bin/my_print_defaults的解决办法
查看>>
文摘《十一》
查看>>
jquery 笔记。。。——》摘自武方博
查看>>
一个夭折,
查看>>
C#开发微信门户及应用(1)--开始使用微信接口(转)
查看>>
Kali-linux使用社会工程学工具包(SET)
查看>>
ScriptManager(脚本控制器)
查看>>
Android chromium 2
查看>>
poj_3468,线段树成段更新
查看>>
什么是mybatis?
查看>>
【算法导论】学习笔记——第6章 堆排序
查看>>
NS3编译运行
查看>>
Python+Appium自动化环境搭建
查看>>
wap网站seo如何优化呢?
查看>>
Java基础-Date类常用方法介绍
查看>>
js 属性getset
查看>>
cursor:hand与cursor:pointer的区别介绍
查看>>