介绍

词频统计：

hash或者一个堆就可以完成，但问题来了，如果内存有限呢？这里我们就可以用trie树来压缩下空间，因为公共前缀都是用一个节点保存的。

前缀匹配:

就拿上面的图来说吧，如果我想获取所有以”a”开头的字符串，从图中可以很明显的看到是：and,as,at，如果不用trie树，你该怎么做呢？很显然朴素的做法时间复杂度为O(N2) ，那么用Trie树就不一样了，它可以做到h，h为你检索单词的长度，可以说这是秒杀的效果。

Trie的关键实现

结构体

struct trie
{
	trie* next[26];//指向谷歌子树的指针
	bool isWord;//标记该节点处是否构成单词
	int count;//统计单词前缀出现的次数
	trie()//构造函数
	{
		for(int i=0;i<26;i++)
		{
			next[i]=NULL;
		}
		isWord=false;
		count=0;
	}
}root;

插入操作（也就是建树）

void insert(char* str)
{
	trie* p=&root;
	int id;
	while(*str)
	{
		id=*str-'a';
		if(p->next[id]==NULL)
		{
			p->next[id]=new trie();
		}
		p->next[id].count++;//此前缀出现的次数加1		
		p=p->next[id];
		str++;
	}
	p->isWord=true;
}

查找操作

bool search(*str)
{
	trie* p=&root;
	int id;
	while(*str)
	{
		id=*str-'a';
		if(p->next[id]==NULL)
		{
			return false;
		}
		else
		{
			p=p->next[id];
			str++;
		}
	}
	if(p->isWord)
		return true;
	else
		return false;
}

释放空间(可不写)

void dealTrie(trie* root)
{
	if(root==NULL)
		return;
	for(int i=0;i<26;i++)
	{
		if(root->next[i]!=NULL)
		{
			dealTrie(root->next[i]);
		}
	}
	delete root;
}

前缀查找的例子

描述

Ignatius最近遇到一个难题,老师交给他很多单词(只有小写字母组成,不会有重复的单词出现),现在老师要他统计出以某个字符串为前缀的单词数量(单词本身也是自己的前缀).

input

输入数据的第一部分是一张单词表,每行一个单词,单词的长度不超过10,它们代表的是老师交给Ignatius统计的单词,一个空行代表单词表的结束.第二部分是一连串的提问,每行一个提问,每个提问都是一个字符串.

output

对于每个提问,给出以该字符串为前缀的单词的数量.

sample input

banana
band
bee
absolute
acm

ba
b
band
abc

sample output

2
3
1
0
杭电1251题

#include<stdio.h>

struct trie
{
	trie* next[26];
	int count;
	trie()
	{
		for(int i=0;i<26;i++)
		{
			next[i]=NULL;
		}
		count=0;
	}
}root;

void insert(char* str)
{
	trie* p=&root;
	while(*str)
	{
		int id=*str-'a';
		if(p->next[id]==NULL)
		{
			p->next[id]=new trie();
		}
		p->next[id]->count++;
		p=p->next[id];
		str++;
	}
}

int search(char* str)
{
	trie* p=&root;
	while(*str)
	{
		int id=*str-'a';
		if(p->next[id]==NULL)
		{
			return 0;
		}
		p=p->next[id];
		str++;
	}
	return p->count;
}

int main()
{
	char str[15];
	while(gets(str)&&str[0]!='\0')//注意这儿的输入方式
	{
		insert(str);
	}
	while(scanf("%s",str)!=EOF)
	{
		int cnt=search(str);
		printf("%d\n",cnt);
	}
	return 0;
}