当前位置：首页 > article >正文

神经网络之CNN文本识别

article 2025/3/6 11:28:18

1.参考我的第一篇文章了解CNN概念

神经网络之CNN图像识别(torch api 调用)-CSDN博客

2.框架

目前对NLP的研究分析应用最多的就是RNN系列的框架，比如RNN,GRU,LSTM等等，再加上Attention，基本可以认为是NLP的标配套餐了。但是在文本分类问题上，相比于RNN，CNN的构建和训练更为简单和快速，并且效果也不差，所以仍然会有一些研究。

那么，CNN到底是怎么应用到NLP上的呢？

不同于CV输入的图像像素，NLP的输入是一个个句子或者文档。句子或文档在输入时经过embedding（word2vec或者Glove）会被表示成向量矩阵，其中每一行表示一个词语，行的总数是句子的长度，列的总数就是维度。例如一个包含十个词语的句子，使用了100维的embedding，最后我们就有一个输入为10x100的矩阵。

在CV中，filters是以一个patch（任意长度x任意宽度）的形式滑过遍历整个图像，但是在NLP中，filters会覆盖到所有的维度，也就是形状为 [filter_size, embed_size]。更为具体地理解可以看下图，输入为一个7x5的矩阵，filters的高度分别为2,3,4，宽度和输入矩阵一样为5。每个filter对输入矩阵进行卷积操作得到中间特征，然后通过pooling提取最大值，最终得到一个包含6个值的特征向量

无疑就是卷积核大小变了长方形，再进行池化

3.api实现

self.filter_sizes = (2, 3, 4)                                   # 卷积核尺寸
self.num_filters = 256                                          # 卷积核数量(channels数)

class Model(nn.Module):
    def __init__(self, config):
        super(Model, self).__init__()
        if config.embedding_pretrained is not None:
            self.embedding = nn.Embedding.from_pretrained(config.embedding_pretrained, freeze=False)
        else:
            self.embedding = nn.Embedding(config.n_vocab, config.embed, padding_idx=config.n_vocab - 1)
        self.convs = nn.ModuleList(
            [nn.Conv2d(1, config.num_filters, (k, config.embed)) for k in config.filter_sizes])#300X2 300x3 300x4 要求nn.Conv2d 要求输入的张量形状为 (N, C_in, H, W)
        self.dropout = nn.Dropout(config.dropout)
        self.fc = nn.Linear(config.num_filters * len(config.filter_sizes), config.num_classes)

    def conv_and_pool(self, x, conv):
        x = F.relu(conv(x)).squeeze(3)#(batch_size, num_filters, new_sequence_length,1)
        x = F.max_pool1d(x, x.size(2)).squeeze(2)#(batch_size, num_filter,new_sequence_length)
        return x

    def forward(self, x):#return (x, seq_len)
        #print (x[0].shape)
        out = self.embedding(x[0])#(batch_size, sequence_length, embed_dim)
        out = out.unsqueeze(1) #(batch_size, 1,sequence_length, embed_dim)
        out = torch.cat([self.conv_and_pool(out, conv) for conv in self.convs], 1)
        out = self.dropout(out)
        out = self.fc(out)
        return out

查看全文

http://www.kler.cn/a/572880.html