字典树

介绍

1

词频统计:

hash或者一个堆就可以完成,但问题来了,如果内存有限呢?这里我们就可以用trie树来压缩下空间,因为公共前缀都是用一个节点保存的。

前缀匹配:

就拿上面的图来说吧,如果我想获取所有以”a”开头的字符串,从图中可以很明显的看到是:and,as,at,如果不用trie树,你该怎么做呢?很显然朴素的做法时间复杂度为O(N2) ,那么用Trie树就不一样了,它可以做到h,h为你检索单词的长度,可以说这是秒杀的效果。

Trie的关键实现

结构体

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
struct trie
{
trie* next[26];//指向谷歌子树的指针
bool isWord;//标记该节点处是否构成单词
int count;//统计单词前缀出现的次数
trie()//构造函数
{
for(int i=0;i<26;i++)
{
next[i]=NULL;
}
isWord=false;
count=0;
}
}root;

插入操作(也就是建树)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
void insert(char* str)
{

trie* p=&root;
int id;
while(*str)
{
id=*str-'a';
if(p->next[id]==NULL)
{
p->next[id]=new trie();
}
p->next[id].count++;//此前缀出现的次数加1
p=p->next[id];
str++;
}
p->isWord=true;
}

查找操作

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
bool search(*str)
{

trie* p=&root;
int id;
while(*str)
{
id=*str-'a';
if(p->next[id]==NULL)
{
return false;
}
else
{
p=p->next[id];
str++;
}
}
if(p->isWord)
return true;
else
return false;
}

释放空间(可不写)

1
2
3
4
5
6
7
8
9
10
11
12
13
void dealTrie(trie* root)
{

if(root==NULL)
return;
for(int i=0;i<26;i++)
{
if(root->next[i]!=NULL)
{
dealTrie(root->next[i]);
}
}
delete root;
}

前缀查找的例子

描述

Ignatius最近遇到一个难题,老师交给他很多单词(只有小写字母组成,不会有重复的单词出现),现在老师要他统计出以某个字符串为前缀的单词数量(单词本身也是自己的前缀).

input

输入数据的第一部分是一张单词表,每行一个单词,单词的长度不超过10,它们代表的是老师交给Ignatius统计的单词,一个空行代表单词表的结束.第二部分是一连串的提问,每行一个提问,每个提问都是一个字符串.

output

对于每个提问,给出以该字符串为前缀的单词的数量.

sample input

banana
band
bee
absolute
acm

ba
b
band
abc

sample output

2
3
1
0
杭电1251题

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
#include<stdio.h>

struct trie
{
trie* next[26];
int count;
trie()
{
for(int i=0;i<26;i++)
{
next[i]=NULL;
}
count=0;
}
}root;

void insert(char* str)
{

trie* p=&root;
while(*str)
{
int id=*str-'a';
if(p->next[id]==NULL)
{
p->next[id]=new trie();
}
p->next[id]->count++;
p=p->next[id];
str++;
}
}

int search(char* str)
{

trie* p=&root;
while(*str)
{
int id=*str-'a';
if(p->next[id]==NULL)
{
return 0;
}
p=p->next[id];
str++;
}
return p->count;
}

int main()
{

char str[15];
while(gets(str)&&str[0]!='\0')//注意这儿的输入方式
{
insert(str);
}
while(scanf("%s",str)!=EOF)
{
int cnt=search(str);
printf("%d\n",cnt);
}
return 0;
}