से:
क्या पाठ :: Unidecode प्रदान करता है एक फ़ंक्शन, unidecode (। ..) जो यूनिकोड डेटा लेता है
इस वाक्य में
यूनिकोड डेटा क्या होता है? क्या यह पर्ल स्ट्रिंग है? यानी एनकोड :: is_utf8 सही होगा यदि इनपुट स्ट्रिंग पर कॉल किया जाता है या यूनिकोड बाइट्स यानी
encode ?
पाठ :: यूनीडोड कोई भी डी- या एन्कोडिंग नहीं करता है यह लिप्यंतरण एक स्ट्रिंग है जिसमें केवल एएससीआईआई कोडपॉइंट्स का इस्तेमाल करते हुए स्ट्रिंग के लिए गैर-एएससीआईआई कोडपॉइंट होते हैं। यह यूटीएफ -8 में स्ट्रिंग को एन्कोडिंग के समान नहीं है।
लिप्यंतरण का अर्थ है कि समान-साउंडिंग टेक्स्ट उत्सर्जित होता है। उदाहरण के लिए, यूनिकोड नहीं बल्कि एएससीआईआई के पास umlauts जैसे
¼ Ã है यह स्ट्रिंग
यू (
\ x75 \ x65 ) या
यू में लिप्यंतरण किया जा सकता है। यदि अक्षर
¼ Ã को यूटीएफ -8 के रूप में एन्कोड किया गया था, तो हमें
\ xC3 \ xBC प्राप्त होगा।
यदि इनपुट में केवल एएससीआईआई श्रेणी में कोडपॉइंट , आउटपुट स्ट्रिंग इनपुट के बराबर है (स्ट्रिंग-समान बराबर)। ऐसी इनपुट स्ट्रिंग के लिए, utf8-flag सेट हो सकता है या नहीं; यह पर्ल प्रोग्रामर के लिए अप्रासंगिक है।
उदाहरण लिप्यंतरण:
"¼ ¼ अच्छा" एक ???? "उबेर कूल" "1 एक · 2" एक ???? "1 * 2" "एक ?? ¬0.9 9" एक ???? "EU0.99" "एक © 2011" एक "??? "(सी) 2011" "एक" "एक" "1/4" "शुद्ध एएससीआईआई" ??? "शुद्ध एएससीआईआई"
No comments:
Post a Comment