不少中文网页中,使用了全角字符,如全角空白,爬取后,无法完全适配删除
如该网页https://www.unjs.com/Special/rudangjijifenzi/,其中每段开头的空白
使用string.replace(html," ","") 也无法替换,//引号中是全角空格
求教,这类字符该如何准确剔除
如该网页https://www.unjs.com/Special/rudangjijifenzi/,其中每段开头的空白
使用string.replace(html," ","") 也无法替换,//引号中是全角空格
求教,这类字符该如何准确剔除










