用Javascript抓取网页内容

Saturday, Nov 26, 2022 | 1 minute read | Updated at Saturday, Nov 26, 2022

打印网页所有h2的内容

Array.from(document.querySelectorAll('h2')).map(x => console.log(x.textContent))

document.querySelectorAll返回类型为NodeListNodeList是不能用map方法的。所以需要用Array.from先把NodeList转换成array,就可以用map对每个元素操作了。

querySelectorAll的参数和CSS一样

querySelectorAll的输入

选中DOM例子

h2

select by tag

.cls1.cls2.cls3

select by class name <h2 class=”cls1 cls2 cls3″>

#id1

select by id

除了用也可以用document.querySelectorAll也可以用document.getElementsByTagName达到一样效果。

Array.from(document.getElementsByTagName('h2')).map(x => console.log(x.textContent))