You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Copy file name to clipboardExpand all lines: 9-regular-expressions/03-regexp-unicode/article.md
+1-11Lines changed: 1 addition & 11 deletions
Display the source diff
Display the rich diff
Original file line number
Diff line number
Diff line change
@@ -92,15 +92,9 @@ Voici les principales catégories de caractères et leurs sous-catégories :
92
92
- Autre `C` :
93
93
- contrôle `Cc`,
94
94
- format `Cf`,
95
-
<<<<<<< HEAD
96
95
- non affecté `Cn`,
97
96
- usage privé `Co`,
98
97
- substitut `Cs`.
99
-
=======
100
-
- not assigned `Cn`,
101
-
- private use `Co`,
102
-
- surrogate `Cs`.
103
-
>>>>>>> fbf443e414097e5a3a41dd1273ef9a4a3230e72c
104
98
105
99
106
100
Ainsi, par exemple si nous avons besoin de lettres en minuscules, nous pouvons écrire `pattern:\p{Ll}`, de signes de ponctuation : `pattern:\p{P}` et ainsi de suite.
Il y a une propriété unicode `Script` (un système d'écriture), qui peut avoir une valeur : `Cyrillic` (Cyrillique), `Greek` (Grec),`Arabic` (Arabe), `Han` (Chinois) et ainsi de suite, [voici la liste complète]("https://en.wikipedia.org/wiki/Script_(Unicode)").
138
-
=======
139
-
There's a unicode property `Script` (a writing system), that may have a value: `Cyrillic`, `Greek`, `Arabic`, `Han` (Chinese) and so on, [here's the full list](https://en.wikipedia.org/wiki/Script_(Unicode)).
140
-
>>>>>>> fbf443e414097e5a3a41dd1273ef9a4a3230e72c
141
131
142
132
Pour rechercher des caractères dans un système d'écriture donné, nous devons utiliser `pattern:Script=<value>`, par exemple pour les lettres cyrilliques : `pattern:\p{sc=Cyrillic}`, pour les hiéroglyphes chinois : `pattern:\p{sc=Han}`, et ainsi de suite :
143
133
@@ -174,4 +164,4 @@ Cela signifie deux choses :
174
164
1. Les caractères de 4 octets sont traités correctement : comme un seul caractère, pas comme deux caractères de 2 octets.
175
165
2. Les propriétés Unicode peuvent être utilisées dans la recherche : `\p{…}`.
176
166
177
-
Avec les propriétés Unicode, nous pouvons rechercher des mots dans des langues données, des caractères spéciaux (guillemets, devises) et ainsi de suite.
167
+
Avec les propriétés Unicode, nous pouvons rechercher des mots dans des langues données, des caractères spéciaux (guillemets, devises) et ainsi de suite.
0 commit comments