folder Tahribat.com Forumları
linefolder Python
linefolder Gelen Veride Türkçe Karakter Sorunu



Gelen Veride Türkçe Karakter Sorunu

  1. KısayolKısayol reportŞikayet pmÖzel Mesaj
    iKlotho
    iKlotho's avatar
    Kayıt Tarihi: 06/Haziran/2015
    Erkek

    UPDATE:  Windows'un code page'i amerika olarak ayarlıymış türkçeye alınca sorun düzeldi.

     

     

     

     

    Can sıkıntısından twitter bot yapmakla uğraşıyorum ancak yazılan twitleri okumaya çalışırken gelen veri türkçe karakterlerde sorun çıkarıyor.

    örneğin şuradaki twiti çekmeye çalıştığımda gelen html dosyasında aşağıdaki şekilde twit dönüyor.   Coding cp1254 kullanıyorum utf-8 de denedim decode etmeyide denedim olmadı.

    requests ve bs modüllerini kullanıyorum.

     

    <meta property="og:description" content="“yayın açık http://t.co/qoy72iZdqV�">


     

     

    def _getTwitContent(self,tId):    
    self.tContentR = self.ssn.get(self.twit_content+tId) print self.tContentR.encoding tContentR_soup = BeautifulSoup(self.tContentR.content) yaz = open('gelen1.html','w') yaz.write(self.tContentR.content) yaz.close() return tContentR_soup.findAll(attrs = {'property':'og:description'})[0]['content']
    iKlotho tarafından 17/Eyl/15 23:14 tarihinde düzenlenmiştir

    Too weird to live, too rare to die.
  2. KısayolKısayol reportŞikayet pmÖzel Mesaj
    YekteranBaymedir
    YekteranBaymedir's avatar
    Kayıt Tarihi: 10/Temmuz/2009
    Homo

    windows kullanıosan IDLE dene bağim bi?

    ayrıca kodlama tarzın hiç pitonik değil .s.s.s

    az daha uğraştıraydın kendini? 

     

    YekteranBaymedir tarafından 17/Eyl/15 18:41 tarihinde düzenlenmiştir
  3. KısayolKısayol reportŞikayet pmÖzel Mesaj
    iKlotho
    iKlotho's avatar
    Kayıt Tarihi: 06/Haziran/2015
    Erkek

    File "C:\Python27\lib\encodings\cp1252.py", line 12, in encode
        return codecs.charmap_encode(input,errors,encoding_table)
    UnicodeEncodeError: 'charmap' codec can't encode character u'\u0131' in position 4: character maps to

    Bu hatayı veriyor decode deneyince. Kod aşağıdaki gibi pycharm kullanıyorum ideyi birazdan denicem

     def _getTwitContent(self,tId):
            self.tContentR = self.ssn.get(self.twit_content+tId)
            tContentR_soup = BeautifulSoup(self.tContentR.content.decode('utf-8'))
            return tContentR_soup.findAll(attrs = {'property':'og:description'})[0]['content']

     

     

    iKlotho tarafından 17/Eyl/15 20:48 tarihinde düzenlenmiştir

    Too weird to live, too rare to die.
  4. KısayolKısayol reportŞikayet pmÖzel Mesaj
    Allura
    Allura's avatar
    Kayıt Tarihi: 17/Mayıs/2009
    Erkek

    scrapy scrapy


    "
Toplam Hit: 1479 Toplam Mesaj: 4
python türkçe karakter sorunu