当前位置：首页 > article >正文

机器学习-智能写作助手

article 2025/2/10 21:31:35

以下为你介绍两种不同方式实现智能写作助手的代码示例，一种是基于简单的机器学习模型（循环神经网络，这里使用 LSTM），另一种是调用 OpenAI 的 GPT 接口实现更强大的智能写作功能。

方式一：基于 LSTM 的简单智能写作助手

1. 安装必要的库

pip install numpy tensorflow

2. 代码实现

import numpy as np
import tensorflow as tf
from tensorflow.keras.preprocessing.text import Tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, LSTM, Dense

# 示例文本数据
text = """人工智能是一门研究如何使计算机能够完成通常需要人类智能才能完成的任务的学科。
它涵盖了机器学习、自然语言处理、计算机视觉等多个领域。机器学习是人工智能的一个重要分支，
它让计算机能够从数据中学习模式和规律，而无需明确的编程指令。"""

# 分词
tokenizer = Tokenizer()
tokenizer.fit_on_texts([text])
total_words = len(tokenizer.word_index) + 1

# 生成输入序列
input_sequences = []
for line in text.split('\n'):
    token_list = tokenizer.texts_to_sequences([line])[0]
    for i in range(1, len(token_list)):
        n_gram_sequence = token_list[:i + 1]
        input_sequences.append(n_gram_sequence)

# 填充序列
max_sequence_len = max([len(x) for x in input_sequences])
input_sequences = np.array(pad_sequences(input_sequences, maxlen=max_sequence_len, padding='pre'))

# 划分输入和目标
xs, labels = input_sequences[:, :-1], input_sequences[:, -1]
ys = tf.keras.utils.to_categorical(labels, num_classes=total_words)

# 构建模型
model = Sequential()
model.add(Embedding(total_words, 100, input_length=max_sequence_len - 1))
model.add(LSTM(150))
model.add(Dense(total_words, activation='softmax'))
model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

# 训练模型
model.fit(xs, ys, epochs=100, verbose=1)

# 生成文本的函数
def generate_text(seed_text, next_words, model, max_sequence_len):
    for _ in range(next_words):
        token_list = tokenizer.texts_to_sequences([seed_text])[0]
        token_list = pad_sequences([token_list], maxlen=max_sequence_len - 1, padding='pre')
        predicted = np.argmax(model.predict(token_list), axis=-1)
        output_word = ""
        for word, index in tokenizer.word_index.items():
            if index == predicted:
                output_word = word
                break
        seed_text += " " + output_word
    return seed_text

# 测试生成文本
seed_text = "人工智能"
next_words = 10
generated_text = generate_text(seed_text, next_words, model, max_sequence_len)
print(generated_text)

3. 代码解释

数据预处理：使用 Tokenizer 对文本进行分词处理，将文本转换为数字序列。然后生成输入序列并进行填充，划分输入和目标。
模型构建：使用 Sequential 模型，包含一个嵌入层、一个 LSTM 层和一个全连接层，使用 softmax 激活函数输出每个词的概率。
模型训练：使用 categorical_crossentropy 损失函数和 adam 优化器进行训练。
文本生成：定义 generate_text 函数，根据输入的种子文本和要生成的词数，循环预测下一个词并添加到种子文本中。

方式二：调用 OpenAI 的 GPT 接口实现智能写作助手

1. 安装必要的库

pip install openai

2. 代码实现

import openai

# 设置你的 OpenAI API 密钥
openai.api_key = "YOUR_API_KEY"

def generate_text(prompt):
    response = openai.ChatCompletion.create(
        model="gpt-3.5-turbo",
        messages=[
            {"role": "user", "content": prompt}
        ]
    )
    return response.choices[0].message.content

# 测试生成文本
prompt = "请写一篇关于人工智能发展前景的短文"
generated_text = generate_text(prompt)
print(generated_text)

3. 代码解释

设置 API 密钥：将 YOUR_API_KEY 替换为你自己的 OpenAI API 密钥。
定义生成文本函数：使用 openai.ChatCompletion.create 方法向 GPT 模型发送请求，传入模型名称和用户的提示信息，返回生成的文本。
测试生成文本：定义一个提示信息，调用 generate_text 函数生成文本并打印输出。