Saturday, 15 May 2010

python - BeautifulSoup and -


इस सवाल का पहले से ही एक उत्तर है: < / P>

  • 1 उत्तर

    मेरा कोड:

      html = "& lt; टैग & gt; & amp; nbsp; & lt; / tag & gt;" बीएस 4 आयात से खूबसूरत सूप प्रिंट खूबसूरत सूट (html) .renderContents ()   

    आउटपुट:

      & lt; tag & gt; एक ?? ¬Ã¡ & lt; / टैग & gt;   

    वांछित आउटपुट:

      & lt; टैग & gt; & amp; nbsp; & lt; / टैग & gt;   

    खूबसूरत सूप को मेरे तोड़ने वाले अंतरिक्ष एचटीएमएल भागने के बजाय एक यूनिकोड वर्ण के साथ बदल दिया गया है जिसका अर्थ है एक ही चीज़। लेकिन यह मेरे सिस्टम के माध्यम से यह बिल्कुल नहीं करता है और नॉन-ब्रेकिंग स्पेस बनता है और इस तरह ऐसा नहीं करता जो मैं चाहता हूं। क्या खूबसूरत सूप को ऐसा करने का कोई तरीका नहीं है?

    का प्रयोग करें encode_contents रेंडर कॉन्टेंट्स के बजाय, या एन्कोड या सुंदरता के बजाय। वे सभी तर्क का समर्थन करते हैं, और 'html' फ़ॉर्मेटर के रूप में पास करें:

      html = "& lt; टैग & gt; & amp; nbsp; & lt; / tag & gt; बीएस 4 आयात से खूबसूरत सूप प्रिंट खूबसूरत सूट (html) .encode_contents (formatter = 'html')   

    पैदा करता है:

      & lt; टैग & gt; & amp; nbsp; & lt ; / टैग & gt;    

No comments:

Post a Comment