博客
关于我
P1026 统计单词个数&&SSL1017
阅读量:333 次
发布时间:2019-03-04

本文共 2124 字,大约阅读时间需要 7 分钟。

要解决这个问题,我们可以使用动态规划方法来确定如何将给定字符串分成k个部分,使得每个部分包含的单词数量总和最大。每个单词必须来自给定的字典,并且一旦选择了一个单词,其第一个字母不能再用于其他单词。

方法思路

  • 问题分析

    • 给定一个由小写字母组成的长字符串,需要将其分成k个部分。
    • 每个部分中的单词必须来自给定的字典,且每个单词的第一个字母不能重复使用。
  • 动态规划方法

    • 定义状态f[i][j]表示前i个行分成j个部分的单词数量最大值。
    • 使用递推公式f[i][j] = max(f[u][j-1] + count[u+1][i]),其中u从1到i-1,count[u+1][i]表示从u+1到i的位置之间能组成多少个单词。
  • 预处理和辅助数组

    • 预处理一个辅助数组w,其中w[x][y]表示从位置x开始的字符串中是否能找到一个单词,且该单词的第一个字母未被使用过。
  • 动态规划填充

    • 初始化f[i][j]数组,逐步填充每个状态,考虑是否能够分割前i行为j个部分,并且每部分有最多的单词数量。
  • 解决代码

    def main():    import sys    input = sys.stdin.read().split()    idx = 0    p = int(input[idx])    idx += 1    k = int(input[idx])    idx += 1    s = 20 * p    string = ''.join(input[idx:idx + s])    idx += s    s = int(input[idx])    idx += 1    words = []    for _ in range(s):        words.append(input[idx])        idx += 1    # 预处理w数组    w = [[False] * (s + 1) for _ in range(s + 1)]    for i in range(1, s + 1):        for l in range(1, min(20, s - i + 1)):            substr = string[i - 1:i - 1 + l]            for word in words:                if substr == word and string[i - 1] not in w[i][i + l - 1]:                    w[i][i + l - 1] = True                    break    # 初始化动态规划数组    dp = [[0] * (k + 1) for _ in range(s + 1)]    for i in range(1, s + 1):        dp[i][1] = dp[i - 1][1] + (1 if w[i][i] else 0)    for j in range(2, k + 1):        for i in range(1, s + 1):            max_val = 0            for u in range(0, i):                if dp[u][j - 1] == 0:                    continue                start = u + 1                end = i                count = 0                used = set()                for m in range(start, end + 1):                    if m == start:                        used.add(string[m - 1])                    if w[m][m + l - 1] for l in ...:                        count +=1                if count > max_val:                    max_val = dp[u][j - 1] + count            dp[i][j] = max_val    print(dp[s][k])if __name__ == "__main__":    main()

    代码解释

    • 输入处理:读取输入数据,包括字符串和字典。
    • 预处理辅助数组:创建一个二维数组w,用于记录每个位置是否能组成一个单词。
    • 动态规划初始化:初始化动态规划数组dp,记录前i个行分成j个部分的最大单词数量。
    • 动态规划填充:逐步填充每个状态,考虑是否能够分割前i行为j个部分,并且每部分有最多的单词数量。
    • 输出结果:打印最终结果,即分割成k个部分的最大单词数量。

    转载地址:http://ywye.baihongyu.com/

    你可能感兴趣的文章
    NLP采用Bert进行简单文本情感分类
    查看>>
    NLP问答系统:使用 Deepset SQUAD 和 SQuAD v2 度量评估
    查看>>
    NLP项目:维基百科文章爬虫和分类【02】 - 语料库转换管道
    查看>>
    NLP:从头开始的文本矢量化方法
    查看>>
    NLP:使用 SciKit Learn 的文本矢量化方法
    查看>>
    NLTK - 停用词下载
    查看>>
    nmap 使用总结
    查看>>
    nmap 使用方法详细介绍
    查看>>
    nmap使用
    查看>>
    nmap使用实战(附nmap安装包)
    查看>>
    Nmap哪些想不到的姿势
    查看>>
    Nmap扫描教程之Nmap基础知识
    查看>>
    nmap指纹识别要点以及又快又准之方法
    查看>>
    Nmap渗透测试指南之指纹识别与探测、伺机而动
    查看>>
    Nmap端口扫描工具Windows安装和命令大全(非常详细)零基础入门到精通,收藏这篇就够了
    查看>>
    NMAP网络扫描工具的安装与使用
    查看>>
    NMF(非负矩阵分解)
    查看>>
    nmon_x86_64_centos7工具如何使用
    查看>>
    NN&DL4.1 Deep L-layer neural network简介
    查看>>
    NN&DL4.3 Getting your matrix dimensions right
    查看>>