Ayuda:Caracteres especiales
http:\\[www.google.com]=
Caracteres ISO-8859-1
Los siguientes caracteres del conjunto ISO-8859-1 (uno de los códigos ASCII extendido) se pueden usar con seguridad en todas las páginas Wiki. La siguiente tabla lista el carácter en sí, el código para cada carácter en decimal y en hexadecimal, el nombre de la entidad HTML, y el nombre común del carácter.
Literal | Hex | Dec | Entidad | Carácter |
---|---|---|---|---|
00A0 | 0160 | |
espacio que no produce saltos de línea | |
¡ | 00A1 | 0161 | ¡ |
exclamación de apertura |
¢ | 00A2 | 0162 | ¢ |
signo de centavo |
£ | 00A3 | 0163 | £ |
signo de libra |
¤ | 00A4 | 0164 | ¤ |
signo internacional de moneda |
¥ | 00A5 | 0165 | ¥ |
signo de yen |
§ | 00A7 | 0167 | § |
signo de sección |
¨ | 00A8 | 0168 | ¨ |
diéresis |
© | 00A9 | 0169 | © |
signo de copyright |
ª | 00AA | 0170 | ª |
indicador ordinal femenino |
« | 00AB | 0171 | « |
comillas anguladas de apertura |
¬ | 00AC | 0172 | ¬ |
signo de negación lógica |
® | 00AE | 0174 | ® |
signo de marca registrada |
¯ | 00AF | 0175 | ¯ |
raya alta |
° | 00B0 | 0176 | ° |
signo de grado |
± | 00B1 | 0177 | ± |
signo de más/menos |
´ | 00B4 | 0180 | ´ |
acento agudo |
µ | 00B5 | 0181 | µ |
signo de micro |
¶ | 00B6 | 0182 | ¶ |
signo de fin de parágrafo |
· | 00B7 | 0183 | · |
punto medio (coma georgiana) |
¸ | 00B8 | 0184 | ¸ |
cedilla |
º | 00BA | 0186 | º |
indicador ordinal masculino |
» | 00BB | 0187 | » |
comillas anguladas de cierre |
¿ | 00BF | 0191 | ¿ |
signo de interrogación de apertura |
À | 00C0 | 0192 | À |
A con acento grave |
Á | 00C1 | 0193 | Á |
A con acento agudo |
 | 00C2 | 0194 |  |
A con acento circunflejo |
à | 00C3 | 0195 | à |
A con tilde |
Ä | 00C4 | 0196 | Ä |
A con diéresis |
Å | 00C5 | 0197 | Å |
A con anillo |
Æ | 00C6 | 0198 | Æ |
Ligadura AE |
Ç | 00C7 | 0199 | Ç |
C cedilla |
È | 00C8 | 0200 | È |
E con acento grave |
É | 00C9 | 0201 | É |
E con acento agudo |
Ê | 00CA | 0202 | Ê |
E con acento circunflejo |
Ë | 00CB | 0203 | Ë |
E con diéresis |
Ì | 00CC | 0204 | Ì |
I con acento grave |
Í | 00CD | 0205 | Í |
I con acento agudo |
Î | 00CE | 0206 | Î |
I con acento circunflejo |
Ï | 00CF | 0207 | Ï |
I con diéresis |
Ñ | 00D1 | 0209 | Ñ |
N con tilde |
Ò | 00D2 | 0210 | Ò |
O con acento grave |
Ó | 00D3 | 0211 | Ó |
O con acento agudo |
Ô | 00D4 | 0212 | Ô |
O con acento circunflejo |
Õ | 00D5 | 0213 | Õ |
O con tilde |
Ö | 00D6 | 0214 | Ö |
O con diéresis |
Ø | 00D8 | 0216 | Ø |
O con barra |
Ù | 00D9 | 0217 | Ù |
U con acento grave |
Ú | 00DA | 0218 | Ú |
U con acento agudo |
Û | 00DB | 0219 | Û |
U con acento circunflejo |
Ü | 00DC | 0220 | Ü |
U con diéresis |
ß | 00DF | 0223 | ß |
doble s (alemán) |
à | 00E0 | 0224 | à |
a con acento grave |
á | 00E1 | 0225 | á |
a con acento agudo |
â | 00E2 | 0226 | â |
a con acento circunflejo |
ã | 00E3 | 0227 | ã |
a con tilde |
ä | 00E4 | 0228 | ä |
a con diéresis |
å | 00E5 | 0229 | å |
a con anillo |
æ | 00E6 | 0230 | æ |
diptongo (ligadura) ae |
ç | 00E7 | 0231 | ç |
c cedilla |
è | 00E8 | 0232 | è |
e con acento grave |
é | 00E9 | 0233 | é |
e con acento agudo i co |
ê | 00EA | 0234 | ê |
e con acento circunflejo |
ë | 00EB | 0235 | ë |
e con diéresis |
ì | 00EC | 0236 | ì |
i con acento grave |
í | 00ED | 0237 | í |
i con acento agudo |
î | 00EE | 0238 | î |
i con acento circunflejo |
ï | 00EF | 0239 | ï |
i con diéresis |
ñ | 00F1 | 0241 | ñ |
n con tilde |
ò | 00F2 | 0242 | ò |
o con acento grave |
ó | 00F3 | 0243 | ó |
o con acento agudo |
ô | 00F4 | 0244 | ô |
o con acento circunflejo |
õ | 00F5 | 0245 | õ |
o con tilde |
ö | 00F6 | 0246 | ö |
o con diéresis |
÷ | 00F7 | 0247 | ÷ |
signo de división |
ø | 00F8 | 0248 | ø |
o con barra |
ù | 00F9 | 0249 | ù |
u con acento grave |
ú | 00FA | 0250 | ú |
u con acento agudo |
û | 00FB | 0251 | û |
u con acento circunflejo |
ü | 00FC | 0252 | ü |
u con diéresis |
ÿ | 00FF | 0255 | ÿ |
y con diéresis |
₫ | 20AB | 20AB | &dong; |
dong |
Estos caracteres son un subconjunto de los símbolos más frecuentemente usados en Internet del juego de caracteres ASCII extendido, ISO 8859-1. Las páginas de Wikipedia son identificadas por el servidor como páginas con texto ISO-8859-1. Los caracteres mencionados anteriormente son un grupo seleccionado para mejorar la compatibilidad con otras máquinas.
Por ejemplo, el Apple Macintosh se utiliza con frecuencia para su uso en Internet, no se encuentra limitado a ningún idioma en especial, y su juego de caracteres nativo (que no es ISO-8859-1) contiene muchos de los caracteres internacionales. Varios navegadores para Macintosh traducen correctamente texto ISO en el juego de caracteres nativo, siempre y cuando los caracteres usados estén disponibles. Así que la tabla descrita antes es un subconjunto de caracteres ISO-8859-1 que también se encuentran disponibles en el juego de caracteres nativo de Macintosh. El documento de código estándar 1252 de Microsoft Windows es un conjunto ampliado de ISO-8859-1, así que estos caracteres también están disponibles en máquinas Windows. Los juegos de caracteres latinos más comunes aparte del ISO-8859-1 son el documento de código MS-DOS 437 (pre-Windows), el Macintosh Roman, y otros conjuntos ISO como el ISO-8859-2. El número de máquinas pre-Windows MS-DOS con navegadores web es reducido y con frecuencia son máquinas dedicadas a un propósito específico que no usarían Wikipedia de todas formas, así que es razonablemente seguro sacrificar la compatibilidad con aquellas máquinas a favor de los caracteres extranjeros necesitados. Otros conjuntos ISO por lo general están orientados para ser leídos por otros navegadores que usan el mismo juego de caracteres en un mismo país, y por lo tanto esas páginas deberían utilizar un juego de caracteres específico a tal idioma.
Estos caracteres pueden ingresarse bien sea usando referencias a entidades HTML conocidas como à
, directamente por medio de algunos teclados, o por medio de cualquier tipo de recurso que esté disponible al autor de páginas Wiki que necesite ingresar estos caracteres. Por ejemplo, autores Wiki que usan máquinas Windows pueden ingresar estos caracteres manteniendo pulsada la tecla Alt mientras que escriben el código decimal de 4 dígitos correspondientes al carácter en el sector numérico del teclado. Es importante que todos los 4 dígitos (incluyendo el 0 del comienzo) se ingresen; usando un código de 3 dígitos producirá que se ingresen caracteres de la obsoleta codificación 437. Autores Wiki que usan máquinas Macintosh deben tener cuidado de usar recursos especiales para ingresar estos caracteres en formato ISO-8859-1 en lugar de hacerlo con el juego de caracteres nativo, o bien puede usar las referencias a entidades HTML conocidas. Note que algunos usuarios de Windows pueden experimentar problemas con versiones del navegador Microsoft Internet Explorer que utilizan "Alt-Flecha Izquierda" y "Alt-Flecha Derecha" para el desplazamiento entre páginas. Estas combinaciones interfieren con el ingreso de códigos que contienen los dígitos 4 y 6. En este caso use referencias a entidades HTML.
Los caracteres de la tabla descrita pueden ser utilizados directamente como caracteres 8-bit en todas las páginas Wiki, y son suficientes para todas las páginas escritas principalmente en inglés, español, francés, alemán e idiomas que no requieren caracteres especiales aparte de aquellos (como el catalán). A pesar de su seguridad general, en este momento, no es posible utilizar estos caracteres en títulos de páginas Wiki en la Wikipedia en inglés, aunque algunos de los Wikipedia Internacionales se encuentran configurados para aceptarlos.
Caracteres no-ISO posiblemente utilizables
Desde hace ya muchos años la web está basada en el repertorio de caracteres Unicode. Se pueden tomar muchos caracteres de este conjunto extendido, ingresándolos ya sea como referencias a entidades HTML o directamente. Los navegadores web los reconocen e interpretan correctamente, quizás utilizando fuentes de carácter alternativas según se requiera. Todos estos caracteres deben ser considerados menos seguros que los mencionados antes, pero solo en el sentido de que puede que no se muestren apropiadamente en algunas máquinas, aunque en forma de referencias a entidades HTML no resultan ambiguos, y preservan la integridad de los datos.
Para muchos de estos, se encuentran disponibles sustitutos adecuados y arreglos, y deberían ser utilizados cuando la importancia de hacer el texto adecuado para usuarios de máquinas y software antiguo sobrepasa la importancia que puede tener una buena presentación para aquellos con software más reciente (a juicio del autor o editor).
Signos de puntuación con estilo
Ausentes en el juego de caracteres ISO-8859-1, pero utilizados con frecuencia y presentes tanto en los conjuntos Macintosh Roman como en el documento de código Windows 1252, y posteriormente incluidos en Unicode, existen algunos signos de puntuación (comillas y rayas) apropiados para idiomas como el inglés y el español que poseen cierto estilo único. Estos pueden ingresarse como referencias a entidades, y deberían mostrarse correctamente en la mayoría de máquinas. Incluso algunos navegadores de modo texto son capaces de realizar las sustituciones apropiadas utilizando simples comillas y rayas de ASCII plano. Muchas de estas referencias no existían en versiones antiguas de HTML, por lo que es posible que no sean reconocidas por software poco reciente. Ya que utilizando estos caracteres se mantiene la integridad de los datos incluso en aquellas máquinas que no los muestran correctamente, se pueden considerar seguros de usar a menos que un despliegue adecuado en software antiguo sea crítico. Las comillas alemanas "low-9" son un caso similar, pero es menos frecuente que sean traducidas por software, y por lo tanto no son tan seguras. La siguiente tabla muestra estos caracteres precediendo a una "O" mayúscula para mejor visibilidad:
‘O | ‘ | comilla izquierda sencilla |
O' | ’ | comilla derecha simple |
“O | “ | comilla izquierda doble |
O” | ” | comilla derecha doble |
—O | — | raya larga |
–O | – | raya corta |
‚O | ‚ | |
„O | „ | comilla low-9 doble |
Muchos sitios web orientados a una audiencia de usuarios de Windows utilizan entidades tomadas del código 1252 para estos caracteres: por ejemplo, utilizando —
para la raya larga. Esta no es una práctica aceptable, ya que se estaría haciendo referencia en realidad al código 151 de Unicode, que sólo tiene un carácter de control. Con el propósito de asegurar la futura integridad de los datos y máxima compatibilidad, se deben reescribir estos caracteres a referencias como —
.
Letras griegas y símbolos matemáticos
Tradicionalmente para representar letras del alfabeto griego y otros símbolos matemáticos en el entorno Windows era común el uso de la tipografía Symbol. Con la adopción generalizada de Unicode este método es no sólo obsoleto sino erróneo. Para usar estos símbolos, ahora es necesario usar, como ya se dijo, entidades HTML o simplemente tipearlos (o copiarlos, ya que no suelen estar en los teclados).
Las letras griegas mayúsculas y minúsculas simplemente usan sus nombres completos como entidades. Estos caracteres deberían, por supuesto, ser utilizados únicamente para representar letras griegas ocasionales en texto principalmente latino. Texto realmente griego debería ser escrito utilizando un juego de caracteres griego para evitar archivos sobrecargados y de pobre respuesta. Aquí hay algunos ejemplos:
α | α |
Γ | Γ |
β | β |
Λ | Λ |
γ | γ |
Σ | Σ |
π | π |
Π | Π |
σ | σ |
Ω | Ω |
ς | ς (sigma "final", únicamente en minúscula) |
Otros símbolos matemáticos comunes:
< | < |
> | > |
≠ | ≠ |
′ | ′ |
≤ | ≤ |
″ | ″ |
≥ | ≥ |
∂ | ∂ |
≡ | ≡ |
∫ | ∫ |
≈ | ≈ |
∑ | ∑ |
∞ | ∞ |
∏ | ∏ |
√ | √ |
Muchos de los símbolos en la fuente de carácter de Windows "Symbol" usados para interpretar símbolos matemáticos (como los segmentos de corchetes expandibles) no están presentes en muchas otras máquinas, y ni siquiera están presentes en el Unicode 3.1 o como entidades HTML (aunque se encuentran planeados para Unicode 3.2). Estos son utilizados en productos como TtH para interpretar ecuaciones. No es posible hoy en día utilizar estos caracteres en páginas web de forma compatible para todos los lectores.
Otros símbolos comunes
Algunos caracteres como la viñeta, el signo de la moneda euro, y el signo de marca registrada son casos especiales. Es muy factible que sean asimilados e interpretados de alguna manera en muchos navegadores. Debido a que son importantes para el comercio internacional, muchos sistemas los agregan a fuentes de carácter en alguna ubicación no-estándar y los interpretan cuando se solicitan, o de lo contrario simplemente los interpreta en modos especiales que no requieren que se encuentren presentes en alguna fuente. Consulte la tabla a continuación para ver cómo interpreta su navegador los siguientes símbolos:
• | • | Viñeta |
€ | € | Signo de la moneda euro |
™ | ™ | Signo de marca registrada |
Entre otros símbolos un poco menos comunes se encuentran los siguientes:
† | † | cruz |
‡ | ‡ | doble cruz |
◊ | ◊ | diamante |
‰ | ‰ | signo por mil |
← | ← | flecha hacia la izquierda |
↑ | ↑ | flecha hacia arriba |
→ | → | flecha hacia la derecha |
↓ | ↓ | flecha hacia abajo |
♠ | ♠ | pinta negra de picas |
♣ | ♣ | pinta negra de tréboles |
♥ | ♥ | pinta negra de corazones |
♦ | ♦ | pinta negra de diamantes |
‹ | ‹ | comilla angulada sencilla de apertura |
› | › | comilla angulada sencilla de cierre |
El uso de estos símbolos debe considerarse inseguro, excepto quizá en páginas orientadas a una audiencia específica que muy probablemente utilice software bastante actualizado sobre máquinas populares.
Unicode
La codificación de caracteres Unicode UCS-4 es la codificación de caracteres oficial en HTML 4.0. Muchos navegadores, sin embargo, solo son capaces de mostrar un pequeño subconjunto del repertorio completo UCS-4. Por ejemplo, los códigos Й ק م
se despliegan en su navegador como Й, ק, y م, los cuales idealmente deberían verse como la letra cirílica "I corta", la letra hebrea "qof", y la letra arábiga "mim", respectivamente. Es poco probable que su computador tenga todas esas fuentes y las muestre correctamente, aunque puede que muestre algunas de ellas. En cualquier caso, debido a que estos caracteres están codificados de acuerdo al estándar, deberán mostrarse correctamente en cualquier sistema que cumpla con el estándar y tenga disponibles los caracteres. Referencias a entidades numéricas son la única manera de ingresar estos caracteres en una página Wiki por el momento. Note que codificarlos utilizando decimal en lugar de hexadecimal (por ejemplo Й
en lugar de Й
) incrementará el número de navegadores en los que la referencia dará resultado.
Vea también Unicode y HTML para consultar tablas de entidades de caracteres.
Véase también
- meta:MediaWiki User's Guide: Creating special characters: la versión más actualizada de este artículo (en inglés)