我试图刮多页网站的内容使用javascript和导出到Excel或csv文件。
问题是我只刮第一页,我无法将其导出到Excel或csv。
以下是目前为止我代码
const PORT =8000
const axios = require('axios')
const cheerio = require('cheerio')
const express = require('express')
const app = express()
const url = 'https://www.taneps.go.tz/epps/viewAllAwardedContracts.do?d-3998960-p=1&selectedItem=viewAllAwardedContracts.do&T01_ps=100'
axios(url)
.then(response => {
const html = response.data
const $ = cheerio.load(html)
const articles = []
$('#T01',html).each(function(){
const contract = $(this).text()
articles.push({
contract
})
})
console.log(articles)
}).catch(err => console.log(err))
app.listen(PORT,() => console.log(`Server listening on port ${PORT}`))
我想刮所有页面,并将其存储在csv或excel文件
1条答案
按热度按时间dbf7pr2w1#
以下是一个可能的解决方案:
输出csv文件
taneps.csv
在
Node v16.15.0
上测试使用的axios v1.1.3
和cheerio v1.0.0-rc.12