ruby-on-rails Rails应用程序中的Web抓取HTML

wgx48brx  于 2023-02-17  发布在  Ruby
关注(0)|答案(1)|浏览(124)

我正在尝试让我的rails应用获取网页的HTML源代码。
我想把来自/news_articles/7这样的URI的所有HTML放到一个字符串中。
我尝试使用类似Nokogiri的东西,但它似乎锁定了互斥锁。
这样做的目的是向Amazon的SES发送一个HTML字符串。
谢谢

qyswt5oh

qyswt5oh1#

NokogiriMechanize结合使用会很好地为您服务。

宝石文件

gem 'nokogiri'
gem 'mechanize'

控制器

agent = Mechanize.new()
# allow the agent to follow redirects
agent.follow_meta_refresh = true
# get the desired page
page = agent.get('http://www.mysite.com/new_articles/7')
# output its html
page.body

Possible Duplicate

相关问题