|
1 | 1 | package tools
|
2 | 2 |
|
3 |
| -import ( |
4 |
| - "regexp" |
5 |
| - "strings" |
6 |
| - "unicode" |
7 |
| - |
8 |
| - "github.com/mozillazg/go-pinyin" |
9 |
| -) |
| 3 | +import "github.com/mozillazg/go-pinyin" |
10 | 4 |
|
11 | 5 | // H is a shortcut for map[string]interface{}
|
12 | 6 | type H map[string]interface{}
|
13 | 7 |
|
14 |
| -// 是否全为英文 |
15 |
| -func isEnglish(str string) bool { |
16 |
| - match, _ := regexp.MatchString(`^[A-Za-z]+$`, str) |
17 |
| - return match |
18 |
| -} |
19 |
| - |
20 |
| -// 是否为英文与数字组合 |
21 |
| -func isEnglishAndNum(str string) bool { |
22 |
| - match, _ := regexp.MatchString(`^[a-zA-Z0-9_-]+$`, str) |
23 |
| - return match |
24 |
| -} |
25 |
| - |
26 |
| -// 是否全为中文 |
27 |
| -func isChinese(s string) bool { |
28 |
| - for _, r := range s { |
29 |
| - if !unicode.Is(unicode.Han, r) { |
30 |
| - return false |
31 |
| - } |
32 |
| - } |
33 |
| - return true |
34 |
| -} |
35 |
| - |
36 |
| -/* |
37 |
| -由于名称的各种组合情况都有,在转换成拼音时也遇到各种各样的问题。这里做一下简单说明,以后将不再处理类似兼容问题,目前兼容如下情况。 |
38 |
| - 1.如果名字中有横杠或者下划线连接,将会删去下划线再处理 |
39 |
| - 2.全是中文:直接转拼音 |
40 |
| - 3.全是英文:不进行处理,原文呈现 |
41 |
| - 4.英文与数字组合,不进行处理,原文呈现 |
42 |
| - 5.如果是中英混合,那么分以下几种情况 |
43 |
| - 1.开头是中文,结尾不是中文:进入Convert逻辑第一种 |
44 |
| - 2.开头不是中文,结尾不是中文:进入Convert逻辑第一种 |
45 |
| - 3.开头不是中文,结尾是中文:进入Convert逻辑第三种 |
46 |
| -
|
47 |
| - 如再有其他情况,将不再进行兼容处理!!! |
48 |
| -*/ |
49 |
| - |
50 |
| -func ConvertToPinYin(src string) string { |
51 |
| - if strings.Contains(src, "-") { |
52 |
| - src = strings.ReplaceAll(src, "-", "") |
53 |
| - } |
54 |
| - if strings.Contains(src, "_") { |
55 |
| - src = strings.ReplaceAll(src, "_", "") |
56 |
| - } |
57 |
| - return Convert(src) |
58 |
| -} |
59 |
| - |
60 |
| -// 将中文内容转成拼音 |
61 |
| -func Convert(src string) string { |
62 |
| - var dst string |
63 |
| - if isChinese(src) { // 全是中文 |
64 |
| - return strings.Join(pinyin.LazyConvert(src, nil), "") |
65 |
| - } |
66 |
| - if isEnglish(src) || isEnglishAndNum(src) { // 全是英文,或者为英文与数字组合 |
67 |
| - return src |
68 |
| - } |
69 |
| - |
70 |
| - han := regexp.MustCompile("([\u4e00-\u9fa5]+)") |
71 |
| - srcIndex := han.FindAllStringIndex(src, -1) |
72 |
| - |
73 |
| - if srcIndex[0][0] == 0 { // 开头是中文 |
74 |
| - dst = strings.ReplaceAll(src, src[srcIndex[0][0]:srcIndex[0][1]], strings.Join(pinyin.LazyConvert(src[srcIndex[0][0]:srcIndex[0][1]], nil), "")+"-") |
75 |
| - } |
76 |
| - if srcIndex[0][0] > 0 && srcIndex[0][1] < len(src) { // 中间是中文 |
77 |
| - dst = strings.ReplaceAll(src, src[srcIndex[0][0]:srcIndex[0][1]], "-"+strings.Join(pinyin.LazyConvert(src[srcIndex[0][0]:srcIndex[0][1]], nil), "")+"-") |
78 |
| - } |
79 |
| - |
80 |
| - if srcIndex[0][1] == len(src) { // 结尾是中文 |
81 |
| - dst = strings.ReplaceAll(src, src[srcIndex[0][0]:srcIndex[0][1]], "-"+strings.Join(pinyin.LazyConvert(src[srcIndex[0][0]:srcIndex[0][1]], nil), "")) |
| 8 | +func ConvertToPinYin(src string) (dst string) { |
| 9 | + args := pinyin.NewArgs() |
| 10 | + args.Fallback = func(r rune, args pinyin.Args) []string { |
| 11 | + return []string{string(r)} |
82 | 12 | }
|
83 | 13 |
|
84 |
| - dstIndex := han.FindAllStringIndex(dst, -1) |
85 |
| - if len(dstIndex) == 0 { |
86 |
| - return dst |
| 14 | + for _, singleResult := range pinyin.Pinyin(src, args) { |
| 15 | + for _, result := range singleResult { |
| 16 | + dst = dst + result |
| 17 | + } |
87 | 18 | }
|
88 |
| - |
89 |
| - return Convert(dst) |
| 19 | + return |
90 | 20 | }
|
0 commit comments