久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

您的位置:首頁技術(shù)文章
文章詳情頁

java字符串搜索匹配問題?

瀏覽:145日期:2024-01-16 14:46:25

問題描述

我有三萬多個(gè)詞匯和它們的詞性(就是動(dòng)詞,名詞,形容詞或者副詞之類的),我想寫個(gè)函數(shù)把以參數(shù)的方式傳遞進(jìn)來的單詞進(jìn)行詞性分析,然后返回它的詞性。

public int analyze(String word){ // 這個(gè)地方應(yīng)該用什么來保存那三萬個(gè)詞匯 // 這個(gè)地方應(yīng)該用怎樣的數(shù)據(jù)結(jié)構(gòu)或算法來判斷word到底在不在我那個(gè)三萬個(gè)詞匯里面 // 怎么做才能功效地判斷出word的詞性 return wordType;}

詞匯-詞性表目前是單純的以行為單位的txt文件

word1 tword2 nword3 a

就這樣,我該怎么做呢,應(yīng)該用什么來存儲(chǔ)我的三萬行數(shù)據(jù),txt,json,xml,或者寫到代碼里面放到數(shù)組里面去呢?哪一個(gè)循環(huán)起來快一些,有什么好的建議?

問題解答

回答1:

你的具體用途是怎樣的,經(jīng)常用到,注重查詢效率?可以用map放內(nèi)存吧

如果不經(jīng)常使用,可以按首字母將詞分割成幾個(gè)文件,每次查詢都可以定位到某個(gè)文件,更快一點(diǎn)。說實(shí)話,三萬其實(shí)挺小的,讀起來應(yīng)該不慢,再夸張點(diǎn)你可以放數(shù)據(jù)庫。

如果有更好的想法再回復(fù)你

回答2:

可以試下hadoop的 map reduce 哦

標(biāo)簽: java
相關(guān)文章:
主站蜘蛛池模板: 中西区| 惠来县| 西安市| 克什克腾旗| 玉溪市| 任丘市| 且末县| 永和县| 东乌| 兴义市| 濉溪县| 延津县| 怀来县| 托克逊县| 合江县| 许昌县| 通道| 东丰县| 延川县| 乌拉特前旗| 霍林郭勒市| 永顺县| 林周县| 仙游县| 南召县| 泾源县| 永州市| 彭州市| 若羌县| 马龙县| 墨江| 普安县| 孝感市| 郯城县| 浦城县| 神池县| 高雄市| 揭东县| 迁西县| 天等县| 寿宁县|