我从一个API中获取数据,其中特殊字符被双重编码。我的意思是'被编码为’。我知道如何解码,但我无法双重解码。我已经尝试了raw和html_safe,但两者都不会解码过去’,即使我加倍,即raw raw或.html_safe.html_safe。我如何才能完全解码这些字符?
kwvwclae1#
这个管用...
require 'rubygems' require 'nokogiri' my_string = "This is Sam’s bicycle" decoded_string = Nokogiri::HTML(my_string.gsub('&','&')).text puts decoded_string => => "This is Sam's bicycle"
8tntrjer2#
我曾经遇到过同样的问题。我对所有HTML问题的解决方法如下:
def format_html_sentence(sentence) Nokogiri::HTML.parse(sentence.gsub(/(\\r|\\n)/, '')).text end
2条答案
按热度按时间kwvwclae1#
这个管用...
8tntrjer2#
我曾经遇到过同样的问题。我对所有HTML问题的解决方法如下: