Beautifulsoup介绍 HTML 文档本身是结构化的文本,有一定的规则,通过它的结构可以简化信息提取。于是,就有了lxml、pyquery、BeautifulSoup等网页信息提取库。一般我们会用这些库来提取网页信息。其中, ...
  100 阅读
  10 条评论
  2019-11-22
阅读全文
Selenium库介绍 Selenium是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7, 8, 9, 10, 11),Mozilla Firefox,S ...
  100 阅读
  10 条评论
  2019-11-22
阅读全文
PhantomJs介绍 PhantomJS是一个基于Webkit的"无界面"(headless)浏览器,它会把网站加载到内存并执行页面上的JavaScript,因为不会展示图形界面,所以运行起来比完整的浏览器更高效。 如果我们把Se ...
  100 阅读
  10 条评论
  2019-11-22
阅读全文
描述pop() 方法用于随机移除一个元素。语法pop() 方法语法: set.pop() 参数 无 返回值返回移除的元素。实例随机移除一个元素:实例 1```python fruits = {"apple", "banana ...
  100 阅读
  10 条评论
  2019-11-20
阅读全文
描述union() 方法返回两个集合的并集,即包含了所有集合的元素,重复的元素只会出现一次。语法union() 方法语法: set.union(set1, set2...) 参数 set1 -- 必需,合并的目标集合 set ...
  100 阅读
  10 条评论
  2019-11-20
阅读全文