Conținut de marketing

Internaționalizare, localizare, codificare, Islanda și traducere a unui site de fotografii cu pisici japoneze

InternaționalizareExistă o mulțime de informații acolo când vine vorba de internaționalizare, localizare și codificare în cadrul aplicațiilor web. Există, de asemenea, o mulțime de neînțelegeri cu privire la ceea ce oferă fiecare pentru o aplicație web. Iată ideea mea ...

Când un browser web face o conexiune la un server web, acesta trece destul de multe variabile și face cereri suplimentare, iată un exemplu:

GET / HTTP / 1.1
Gazdă: www.dknewmedia.com
User-Agent: Mozilla / 5.0 (Macintosh; U; Intel Mac OS X; en-US; rv: 1.8.1.3) Gecko / 20070309 Firefox / 2.0.0.3
Accept: HTTP Accept = text / xml, application / xml, application / xhtml + xml, text / html; q = 0.9, text / plain; q = 0.8, image / png, * / *; q = 0.5
Accept-Language: en-us, en; q = 0.5
Acceptare-codificare: gzip, deflate
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7

Internaționalizare

Internaționalizarea este un compozit din multe lucruri:

  1. Localizare: Capacitatea de a identifica din ce limbă și locație vizitează un vizitator. Acest lucru se face prin Solicitări HTTP în care vizitatorul este identificat de o localizare. În cazul meu, asta este en-SUA. „En” este engleză și „SUA” este Statele Unite. Aceasta este o setare din sistemul meu de operare.
  2. Fusuri orare: Capacitatea de a vă ajusta pentru fusurile orare. Acest lucru se realizează în mod normal prin setarea serverului la Greenwich Mean Time (GMT) și apoi permițând utilizatorilor să își seteze offsetul local de GMT.
  3. Codificarea caracterelor: Aceasta este capacitatea de a afișa corect seturile de caractere. Este diferit de localizare, deoarece localizarea îmi poate spune limba și regiunea computerului din care face cererea, dar nu îmi va spune în ce limbă cititor solicită ... asta depinde de cititor!

Observați în antetul meu HTTP când browserul a făcut cererea, acesta a comunicat serverului că solicită localizarea mea (Accept-Language: en-us); totuși, trebuie să spună și serverului ce set de caractere este solicitat (Accept-Charset: Accept-Charset: ISO-8859-1, utf-8; q = 0.7, *; q = 0.7) ISO-8859-1 și utf -8 sunt ambele seturi de caractere permise.

Localizare

În această lume fantastică amestecată, localizarea nu mai dictează niciodată limba. Chiar dacă sunt în SUA, pot citi absolut o altă limbă folosind un set de caractere diferit ... asta se întâmplă când folosesc Google Hindi (Nu prea folosesc Google Hindi). Solicitarea mea pentru setările locale și de caractere este identică cu cea în care solicit Google engleză pagină, dar sunt hrănită de fapt cu o pagină pe care nu o pot citi pentru că nu am setul de caractere. Totul apare ??????????? ... Cu toate acestea, pot încărca setul de caractere în Firefox (Firefox> Preferințe> Avansat> Limbi):

Limbă de încărcare Firefox

Dacă încărc limba respectivă, pot solicita pagina în setul de caractere nativ și o pot afișa pe computerul meu, chiar dacă locația mea implicită este en-US!

Deci ... dacă sunt student la hindi, studiez engleza la Purdue și sunt conectat prin VPN pe serverul școlii, în vacanță în Australia ... există 3 setări diferite care trebuie aplicate aplicației pentru a fi cu adevărat internaționalizate - și nici unul depinde de celălalt.

Locația mea ar apărea ca en-US, dar fusul meu orar este Australia, dar limba pe care o solicit de pe site poate fi hindi. Dacă ar fi să-mi programez aplicația ipoteze pe baza localizării computerului meu, aș greși total - hrănind persoana engleză într-un fus orar estic. În mod ideal, aș programa aplicația mea de oferit atât setările de limbă și fus orar ... dar nu le-aș presupune în funcție de locale.

Islanda - exemplul suprem

Suntem ignoranți cu privire la provocările multilingve și multi-locale din Statele Unite unde ne aflăm toate vorbește engleză [sarcasm implicit]. În unele țări, cum ar fi Islanda, deși limba maternă este islandeză, islandezii incredibili cresc învățând 3 limbi! Deoarece Islanda este o țară din mijlocul Europei și Americii de Nord, companiile lor lucrează pe mai multe continente, limbi, dialecte de limbi și fusuri orare multiple de pe desktop!

Multe site-uri islandeze sunt construite în engleza SUA, engleza britanică, islandeză, spaniolă, spaniolă, franceză și germană! Imaginați-vă cât de dificil ar fi să construiți Icelandair's aplicații de site-uri web și sisteme de ticketing ... wow!

DISCLAIMER: Am avut plăcerea absolută de a lucra cu cei buni de la Icelandair și vă pot spune că sunt unii dintre cei mai talentați și prietenoși profesioniști cu care am avut plăcerea de a lucra. Este pur și simplu o țară și oameni uimitori! Mergeți în vizită ... luați Icelandair și asigurați-vă că vizitați Blue Lagoon!

Limbaj versus codificare

Există chiar și diferite codificări de caractere într-o singură limbă care nu se joacă bine între ele! Exemplu: un e-mail japonez scris în Shift-JIS se poate face ilizibil pe computerul unei persoane japoneze cu localizare setată la ja-JP, deoarece serverul de poștă electronică recunoaște doar EUC-JP. În mod ideal, un client ar trebui să poată stabili ce codare ar dori, precum și ce limbă - asigurându-se pur și simplu că codarea și limba sunt compatibile cu ceea ce solicită clientul.

Dacă doresc să citesc japoneza, este posibil să trebuiască să selectez atât limba japoneză ca limbă, cât și Shift-JIS pentru codificare pentru a afișa corect limba respectivă. Iată mai multe confuzii de adăugat la mix ... unele tipuri de codificare acceptă mai multe limbi. UNICODE / UTF8 acceptă zeci. Reversul este adevărat, de asemenea. Unele limbi pot fi citite în mai multe tipuri de codificare. Dacă asta nu are sens ... Îmi cer scuze, este o problemă foarte complexă.

Într-o zi cred (sper) că totul se va schimba. Cred că proiectanții originali ai codurilor de localizare au sperat că combinația limbă-țară ar fi tot ce este necesar ... dar am devenit mult mai sofisticați. Amintiți-vă, o mare parte din acest lucru a fost dezvoltat înainte de a exista un Internet. Odată cu apariția GIS, poate o persoană își poate selecta codificarea, iar GIS se ocupă de fusul orar și informațiile locale.

Internaționalizare

Înapoi la suport pentru internaționalizare. Dacă doriți să furnizați o aplicație internaționalizată, trebuie să:

  1. Acceptați mai multe tipuri de codificare, limbi și aveți fișiere de traducere pentru a afișa aceste traduceri.
  2. Permiteți clientului să își stabilească limba și chiar tipul de codificare, dacă este necesar.
  3. Sprijiniți fusurile orare, permițându-le utilizatorilor să își facă referire la fusul orar în comparație cu GMT.
  4. Utilizați codurile de localizare cu precauție ... NU descriu cu exactitate ceea ce solicită de fapt utilizatorul dvs. și nici ce pot citi.

Traducere

Traducerea automată este încă la început. Există mai multe site-uri web (și WordPress Plugin-uri) care oferă traducere automată a site-ului dvs. Nu fiți tentat să faceți acest lucru ... există două motive pentru care:

  1. Dacă traducerea automată funcționează, utilizatorul care verifică site-ul dvs. va avea deja un traducător cu care să lucreze.
  2. Traducerea automată e de rahat.

Nu mă crede? Iată o traducere în japoneză pentru dvs.:
Lipit din Fișier Masatsu - un tip cu o tonă de poze cu pisici:

Intrare pe blog japonez

??????
- 00:29:35 de masatsu

???????????????????????????
??????????????????????????

?????????? (?)?

????????????????????????????????????????
????????????????????????????????

???????????????????????????????????? (?)

?????????????????

??????????????
??????
??????

???????????????????????????????????????

???????????????????????????????

???????????????????????????????????????
??????????????????????????????????
?????????? Ag ???????????????

?????????????????????????????????????

Traducere automată:

?? Hann?????
-00: 29: 35 de masatsu

Numele sfântului pumn al unui / elefant care a apărut ieri pe „flota pumnului fiarei ?? ranger ”„ ?? Hann ???? ” cu un / actorul de radio Yutaka Mizushima….

? (?) care face sepia cu ușurință.

Pentru că până și actorul de radio al sfântului pumn, stăpâne ????? a / pisicii sunt gutuiul chinezesc al unui Nagai Ichiro = dragon ball toiagul a / the ?? Ranger arată ca oamenii care remarcă înțelept știu cu ușurință.

?????? (Sudoarea) pe care o uitam complet anul acesta „secretul numelui super flotei”, de practică obișnuită în fiecare an?,

?????? Dacă scriu tardiv anul acesta,

??????? altar ??? (cum se poate?)? tăiere promontoriu (?? tăiat nu) Fukami ?? (? sau observa capabil?) un / este ceea ce face

?????? Cu, devine „a can /? /?”, Cu alte cuvinte, „kung fu”, când se aliniază și se schimbă capul a / the name.

?????? Deși se spune că crește încă două, se presupune că poate deveni ce fel de nume.

Adevărul se spune că este „vârsta”, deoarece simbolul elementului argintiu este Ag?, Deși numele „???? argint ”Takaoka? tehnician de ??????? se gândea că personajul numit „?” a fost utilizat cu asocierea unui film de argint, dacă îl numește cu un membru suplimentar.

?????? Cu toate acestea, mă gândesc egoist, că teoria mea nu are legătură cu faptul că „?” este inclus în a / caracterul chinezesc.

Sunt sigur că inversarea polarității acestei traduceri ar oferi o dicție la fel de lizibilă în limba engleză. Ai înțeles intrarea, nu?

Douglas Karr

Douglas Karr este CMO al OpenINSIGHTS și fondatorul Martech Zone. Douglas a ajutat zeci de startup-uri de succes MarTech, a ajutat la due diligence de peste 5 miliarde de dolari în achiziții și investiții Martech și continuă să asiste companiile în implementarea și automatizarea strategiilor lor de vânzări și marketing. Douglas este un expert în transformare digitală recunoscut la nivel internațional și expert și vorbitor MarTech. Douglas este, de asemenea, un autor publicat al unui ghid pentru Dummie și al unei cărți de conducere în afaceri.

Articole pe aceeaşi temă

Înapoi la butonul de sus
Închide

Blocarea reclamelor a fost detectată

Martech Zone este în măsură să vă furnizeze acest conținut fără costuri, deoarece monetizăm site-ul nostru prin venituri din reclame, linkuri afiliate și sponsorizări. Am aprecia dacă ați elimina dispozitivul de blocare a reclamelor pe măsură ce vizualizați site-ul nostru.