博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
跑实验记录一
阅读量:6568 次
发布时间:2019-06-24

本文共 1440 字,大约阅读时间需要 4 分钟。

1.使用tagger&wikipedia-pubmed-and-PMC-w2v词向量

Loading pretrained embeddings from ../.local/lib/python3.5/site-packages/neuroner/data/word_vectors/wikipedia-pubmed-and-PMC-w2v.txt...WARNING: 5443657 invalid linesLoaded 0 pretrained embeddings.0 / 18309 (0.0000%) words have been initialized with pretrained embeddings.0 found directly, 0 after lowercasing, 0 after lowercasing + zero.Compiling...

词向量无效的问题。

2.使用tagger&PMC-w2v词向量

Loading pretrained embeddings from ./dataset/PMC-w2v.txt...WARNING: 2515687 invalid linesLoaded 0 pretrained embeddings.0 / 18141 (0.0000%) words have been initialized with pretrained embeddings.0 found directly, 0 after lowercasing, 0 after lowercasing + zero.Compiling...

 

 依旧是词向量不能加载的问题。

解决:找到原因了,因为词向量中的维度和默认维度不同,需要指定默认维度啊,--word_dim 200。即可:

Found 10407 unique words (115614 in total)

Loading pretrained embeddings from ./dataset/PMC-w2v.txt...
Found 80 unique characters
Found 9 unique named entity tags
4595 / 4598 / 4840 sentences in train / dev / test.
Saving the mappings to disk...

Loading pretrained embeddings from ./dataset/PMC-w2v.txt...WARNING: 1 invalid linesLoaded 2515686 pretrained embeddings.17963 / 18141 (99.0188%) words have been initialized with pretrained embeddings.17876 found directly, 46 after lowercasing, 41 after lowercasing + zero.Compiling...

 

目前使用的是Att中的CDR数据集进行训练的。

3.使用tagger和chemdner_pubmed_drug.word2vec_model_token4_d50词向量

 

转载于:https://www.cnblogs.com/BlueBlueSea/p/10724243.html

你可能感兴趣的文章
32岁老程序员的现状和尴尬,无奈中透露些许悲凉,有选择却更痛苦
查看>>
WPF MeshGeometry3D
查看>>
puppet cron 模块
查看>>
mysql 协议的ResultsetRow包及解析
查看>>
Ymal格式转Properties格式
查看>>
一个生成全局唯一Sequence ID的高并发工厂类 (Java)
查看>>
调优之系统篇--cpu,内存
查看>>
解决jQuery和其它库的冲突
查看>>
写在除夕夜
查看>>
JAVA中的list去重复
查看>>
JAVA 代码里中文乱码问题
查看>>
Grub的安装方法
查看>>
SpringMVC通过注解方式读取properties文件中的值
查看>>
Spring+Dubbo+Zookeeper简单框架与使用
查看>>
Open Cascade DataExchange DXF
查看>>
Greenplum Hadoop分布式平台大数据解决方案实战教程
查看>>
编译安装LAMP之配置httpd以FastCGI方式与php整合
查看>>
Haproxy
查看>>
性能调优之Java系统级性能监控及优化
查看>>
SylixOS内核打印调试方法
查看>>