sql >> Base de Datos >  >> NoSQL >> MongoDB

La inserción de mongodb muestra 'las cadenas en los documentos deben ser UTF-8 válidos'

Si usa PyMongo y Python 2.x, debe usar str en cadenas utf-8 o Unicode. Ver:http://api.mongodb .org/python/current/tutorial.html#a-note-on-unicode-strings

Si data es un dict con múltiples cadenas, puede convertirlas todas a Unicode usando la siguiente función:

def convert2unicode(mydict):
    for k, v in mydict.iteritems():
        if isinstance(v, str):
            mydict[k] = unicode(v, errors = 'replace')
        elif isinstance(v, dict):
            convert2unicode(v)

for code, data in dict_data.items(): 
    try:
        convert2unicode(data)
        collection2.insert({'_id':code,'data': data})
    except Exception as e:
        print code,'>>>>>>>', str(e)
        sys.exit()

El código anterior convertirá todos los valores de str en Unicode, las "claves" se mantienen intactas, dependiendo de la causa principal, también debe convertir las "claves".