Saturday, 15 March 2014

string - What is the input of unidecode? -


से:

क्या पाठ :: Unidecode प्रदान करता है एक फ़ंक्शन, unidecode (। ..) जो यूनिकोड डेटा लेता है

इस वाक्य में यूनिकोड डेटा क्या होता है? क्या यह पर्ल स्ट्रिंग है? यानी एनकोड :: is_utf8 सही होगा यदि इनपुट स्ट्रिंग पर कॉल किया जाता है या यूनिकोड बाइट्स यानी encode ?

पाठ :: यूनीडोड कोई भी डी- या एन्कोडिंग नहीं करता है यह लिप्यंतरण एक स्ट्रिंग है जिसमें केवल एएससीआईआई कोडपॉइंट्स का इस्तेमाल करते हुए स्ट्रिंग के लिए गैर-एएससीआईआई कोडपॉइंट होते हैं। यह यूटीएफ -8 में स्ट्रिंग को एन्कोडिंग के समान नहीं है।

लिप्यंतरण का अर्थ है कि समान-साउंडिंग टेक्स्ट उत्सर्जित होता है। उदाहरण के लिए, यूनिकोड नहीं बल्कि एएससीआईआई के पास umlauts जैसे ¼ Ã है यह स्ट्रिंग यू ( \ x75 \ x65 ) या यू में लिप्यंतरण किया जा सकता है। यदि अक्षर ¼ Ã को यूटीएफ -8 के रूप में एन्कोड किया गया था, तो हमें \ xC3 \ xBC प्राप्त होगा।

यदि इनपुट में केवल एएससीआईआई श्रेणी में कोडपॉइंट , आउटपुट स्ट्रिंग इनपुट के बराबर है (स्ट्रिंग-समान बराबर)। ऐसी इनपुट स्ट्रिंग के लिए, utf8-flag सेट हो सकता है या नहीं; यह पर्ल प्रोग्रामर के लिए अप्रासंगिक है।

उदाहरण लिप्यंतरण:

  "¼ ¼ अच्छा" एक ???? "उबेर कूल" "1 एक · 2" एक ???? "1 * 2" "एक ?? ¬0.9 9" एक ???? "EU0.99" "एक © 2011" एक "??? "(सी) 2011" "एक" "एक" "1/4" "शुद्ध एएससीआईआई" ??? "शुद्ध एएससीआईआई"    

No comments:

Post a Comment