深度学习样本中文标注的支持问题

深度学习样本中文标注的支持问题
已邀请:

李明

赞同来自:

有监督深度学习任务中,要人工标注部分数据做训练。一般不建议设置中文标注名称。
因为训练深度学习模型过程,训练代码加载esri_accumulated_stats.json没有显示指定编码方式,esri_accumulated_stats.json是以utf-8编码的,然后会使用操作系统的默认编码读取json文件,windows中文环境会使用gbk,导致解码问题。
 
如果是中文标注,模型训练输出的emd中中文会以unicode方式存储。
 
如果是linux环境默认编码是utf-8,使用RA server的深度学习 rest api可以正常输出。
核心问题还是json模块默认读取中文的解码问题
 
 

要回复问题请先登录注册