注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

星期五

明天不上班

 
 
 

日志

 
 
关于我

一个特立独行的Java程序员,比较宅,上上网,写博客,听音乐,看电影。

网易考拉推荐

Levenshtein Distance(计算字符串的相似度)  

2011-10-08 22:56:40|  分类: Java |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
Apache commons lang StringUtils类时,看到一个方法

getLevenshteinDistance

public static int getLevenshteinDistance(String s, String t)

Find the Levenshtein distance between two Strings.

那么什么是Levenshtein Distance  (又叫编辑距离)


摘自百度百科 http://baike.baidu.com/view/2020247.htm

编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。

例如将kitten一字转成sitting: sitten (k→s)  sittin (e→i)  sitting (→g) 俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。

我只关心应用,实现的话StringUtils已经帮我们实现了

DNA分析  拼字检查  语音辨识  抄袭侦测


  评论这张
 
阅读(517)| 评论(0)
推荐

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017