limbajul sgml. Limbaje de marcare: SGML, HTML, XML

Poveste

Să ne uităm la un exemplu de rețetă simplă marcată folosind XML:

> Pâine simplă > > Făină > Drojdie > Apa calda > Sare > > > > Se amestecă toate ingredientele și se frământă bine. > > Acoperiți cu o cârpă și lăsați o oră într-o cameră caldă. > > Se framanta din nou, se pune pe o tava de copt si se da la cuptor. > > >

Declarație XML

Prima linie a documentului XML este numită Declarație XML(Engleză) Declarație XML) este un șir care indică versiunea XML. În versiunea 1.0 Declarație XML poate fi omis, în versiunea 1.1 este necesar. Codificarea caracterelor și prezența dependențelor externe pot fi de asemenea indicate aici.

Specificația necesită procesoare XML să accepte codificări Unicode UTF-8 și UTF-16 (UTF-32 este opțional). Alte codificări bazate pe standardul ISO/IEC 8859 sunt recunoscute ca acceptabile, acceptate și utilizate pe scară largă (dar nu sunt necesare și alte codificări, de exemplu, Windows-1251 rusesc, KOI-8). Adesea, literele non-latine nu sunt folosite în etichete, în acest caz, UTF-8 este o codificare foarte convenabilă - volumul este de obicei mai mic decât cu UTF-16; decodarea poate fi efectuată atât pentru întregul document, cât și pentru atribute și texte specifice; întregul document nu conține caractere interzise atunci când se încearcă analizarea cu codificare incorectă.

Element rădăcină

Cea mai importantă cerință sintactică obligatorie este ca documentul să aibă doar una element rădăcină(Engleză) element rădăcină) (numit și uneori element de document(Engleză) element de document)). Aceasta înseamnă că textul sau alte date ale întregului document trebuie să fie situate între o singură etichetă rădăcină de început și eticheta de final corespunzătoare.

Următorul cel mai simplu exemplu- un document XML bine format:

Următorul exemplu nu este un document XML valid deoarece are două element rădăcină:

> Entitatea #1 > > Entitatea #2 >

Un comentariu

Un element poate fi plasat oriunde în copac - un comentariu. Comentariile XML sunt plasate într-o etichetă specială, începând cu caracterele. Două cratime (--) nu pot fi prezente într-un comentariu.

Etichetele din interiorul unui comentariu nu trebuie procesate.

Etichete

Restul acestui document XML constă din imbricate elemente, dintre care unele au atributeȘi conţinut. Element de obicei constă în etichete de deschidere și închidere care includ text și alte elemente. Eticheta de deschidere cuprinde numele elementuluiîn paranteze unghiulare, de exemplu, , A eticheta de inchidere constă din același nume între paranteze unghiulare, dar înaintea numelui este adăugată o bară oblică, de exemplu,. Numele elementelor, ca și numele atributelor, nu pot conține spatii, dar poate fi în orice limbă acceptată de codarea documentului XML. Numele poate începe cu o literă, un caracter de subliniere sau două puncte. Caracterele rămase ale numelui pot fi aceleași caractere, precum și numere, cratime și puncte.

Există mai multe entități predefinite în XML, cum ar fi lt (vă puteți referi la el scriind<) для левой угловой скобки и amp (ссылка - &) для амперсанда. Возможно также определять собственные сущности. Помимо записи с помощью сущностей отдельных символов, их можно использовать для записи часто встречающихся текстовых блоков.

Mai jos este un exemplu de utilizare a unei entități predefinite pentru a evita utilizarea unui ampersand în nume:

> AT&T >

Lista completă a entităților predefinite constă din &(&),< (<), >(>), " (") și " (") - ultimele două sunt utile pentru scrierea delimitatorilor în valorile atributelor. Vă puteți defini entitățile într-un document DTD.

Uneori este necesar să se definească un spațiu care nu se întrerupe, care este foarte des folosit în HTML și este notat ca. Nu există o astfel de entitate predefinită în XML, este scrisă, iar utilizarea ei provoacă o eroare. Absența acestei entități foarte comune vine adesea ca o surpriză pentru mulți programatori, iar acest lucru creează unele dificultăți la migrarea dezvoltărilor lor HTML la XML.

Legătură prin număr simbol(Engleză) referință de caractere numerice) arată ca o referință la o entitate, dar în loc de numele entității, este specificat caracterul # și un număr (în notație zecimală sau hexazecimală), care este numărul caracterului din tabelul cu caractere Unicode. Acestea sunt de obicei caractere care nu pot fi codificate direct, cum ar fi o literă arabă într-un document codificat ASCII. Ampersand poate fi reprezentat astfel:

> AT&T >

Există și alte reguli privind crearea unui document XML valid.

Avantaje și dezavantaje

Avantaje

Defecte

  • Modelarea ambiguității.
  • XML nu are suport pentru tipul de date încorporat în limbaj. Nu are tastare puternică, adică conceptele de „întregi”, „șiruri”, „date”, „booleeni”, etc.
  • Modelul de date ierarhic oferit de XML este limitat în comparație cu modelul relațional și cu modelul de date de rețea și grafic orientat pe obiecte.

Afișarea XML pe World Wide Web

Cele mai comune trei moduri de a converti un document XML într-o formă afișată de utilizator sunt:

  1. Aplicarea stilurilor CSS;
  2. Aplicarea XSL;
  3. Scrierea unui handler de document XML în orice limbaj de programare.

Pentru a specifica o transformare XSL (XSLT) pe partea clientului, trebuie să fie prezente următoarele instrucțiuni XML:

Dicționare XML

Deoarece XML este un limbaj destul de abstract, au fost dezvoltate vocabulare XML.

Un dicționar permite dezvoltatorilor să convină asupra unui set finit de nume de etichete și asupra atributelor acelor etichete. Unul dintre primele vocabulare este XHTML, care este înțeles de majoritatea browserelor. XHTML este adesea folosit pentru a stoca și edita conținut într-un CMS.

Au fost create vocabulare mai specializate, cum ar fi protocolul de transfer de date SOAP, care nu este prietenos cu oamenii și este destul de greu de citit. Există vocabulare comerciale precum CommerceML, xCBL și cXML care sunt folosite pentru a transfera date orientate spre comerț, aceste dicționare includ descrieri ale sistemului de comandă, furnizori, produse și multe altele.

De obicei, atunci când descrie un document, o persoană vine cu un vocabular pentru sine, care este apoi descris folosind DTD, XSD sau pur și simplu explicat „din mers” părților interesate.

Unul dintre dicționarele care au primit utilizare largă, este un dicționar FB2 care descrie formatul unei cărți, cu tot felul de note de subsol, citate, chiar imagini.

versiuni XML

  • XML 1.0
  • XML 1.1

Vezi si

Note

Literatură

  • David Hunter, Jeff Rafter, Joe Faucett, Eric van der Vlist etc. XML. Lucrul cu XML, ediția a 4-a = XML început, ediția a 4-a. - M.: „Dialectica”, 2009. - 1344 p. - ISBN 978-5-8459-1533-7
  • David Hunter, Jeff Rafter și alții. XML. Curs de bază= Începutul XML. - M.: Williams, 2009. - 1344 p. - ISBN 978-5-8459-1533-7
  • Robert Tabor. Implementarea serviciilor XML Web pe platforma Microsoft .NET = Microsoft .NET XML Web Services. - M.: Williams, 2002. - 464 p. - ISBN 0-672-32088-6

Legături

  • XML pe site-ul web World Wide Web Consortium (W3C).
  • Specificație standard oficială XML 1.0
  • Specificația standard oficială XML 1.1
  • Documentație XML pe site-ul IBM articole, forumuri

Standardul definește două niveluri de corectitudine pentru un document XML:

  • Construit corect(Bine format). Un document corect construit îndeplinește toate reguli generale Sintaxa XML aplicabilă oricărui document XML. Și dacă, de exemplu, eticheta de început nu are o etichetă de final corespunzătoare, atunci aceasta construit incorect document XML. Un document care nu este construit corect nu poate fi considerat un document XML; Procesorul XML (parser) nu ar trebui să-l proceseze în mod normal și ar trebui să clasifice situația ca o eroare fatală.
  • Valabil(Valabil). În plus, un document valid respectă anumite reguli semantice. Aceasta este o verificare suplimentară mai strictă a corectitudinii documentului pentru conformitatea cu reguli predeterminate, dar deja externe, pentru a minimiza numărul de erori, de exemplu, structura și compoziția unui anumit document sau familie de documente. Aceste reguli pot fi dezvoltate fie de către utilizator însuși, fie de către dezvoltatori terți, de exemplu, dezvoltatorii de dicționare sau standarde de schimb de date. De obicei, astfel de reguli sunt stocate în fișiere speciale - scheme, unde este cel mai mult detaliat sunt descrise structura documentului, toate denumirile valide de elemente, atribute și multe altele. Și dacă un document, de exemplu, conține un nume de element care nu este definit anterior în scheme, atunci documentul XML este considerat gol; La verificarea conformității cu regulile și schemele, procesorul XML de verificare (validator) este obligat (la alegerea utilizatorului) să raporteze o eroare.

Aceste două concepte nu au o traducere standardizată bine stabilită în rusă, în special conceptul valabil, care poate fi tradus și ca valabil, legitim, de încredere, potrivi, sau chiar testat pentru conformitatea cu reguli, standarde, legi. Unii programatori folosesc hârtie de calc consacrată în viața de zi cu zi " Valabil».

Sintaxa XML

Această secțiune discută doar construcție corectă Documentele XML, adică sintaxa lor.

XML este o structură ierarhică concepută pentru a stoca orice date, structura poate fi reprezentată ca un arbore. Cea mai importantă cerință sintactică obligatorie este ca documentul să aibă doar una element rădăcină(element rădăcină) (denumit alternativ element de document). Aceasta înseamnă că textul sau alte date ale întregului document trebuie să fie amplasate între singurul o etichetă rădăcină de început și eticheta de final corespunzătoare.

Următorul exemplu cel mai simplu este un document XML bine format: Aceasta este cartea: „Little Book” Prima linie a documentului XML este numită Declarație XML(Declarația XML) este un șir opțional care indică versiunea standardului XML (de obicei 1.0) și poate include, de asemenea, codificarea caracterelor și dependențe externe. Specificația necesită procesoare XML să accepte codificări Unicode UTF-8 și UTF-16 (UTF-32 este opțional). Alte codificări bazate pe standardul ISO/IEC 8859 sunt recunoscute ca acceptabile, acceptate și utilizate pe scară largă (dar nu sunt necesare și alte codificări, de exemplu, Windows-1251 rusesc, KOI-8).

Un comentariu poate fi plasat oriunde în copac. Comentariile XML sunt plasate într-o pereche de etichete . Două cratime (--) nu pot fi folosite nicăieri într-un comentariu.

Mai jos este un exemplu de rețetă simplă de gătit marcată folosind XML:

Pâine simplă Făină Drojdie Apa calda Sare

Structura

Restul acestui document XML constă din imbricate elemente, dintre care unele au atributeȘi conţinut. Element de obicei constă în etichete de deschidere și închidere care includ text și alte elemente. Eticheta de deschidere constă din numele elementului între paranteze unghiulare, de exemplu, „ »; eticheta de inchidere constă din același nume între paranteze unghiulare, dar înaintea numelui este adăugată o bară oblică, de exemplu, „ ». Conținutul elementului(conținut) este tot ceea ce se află între etichetele de deschidere și de închidere, inclusiv text și alte elemente (imbricate). Mai jos este un exemplu de element XML care conține o etichetă de deschidere, o etichetă de final și conținutul elementului:

Se framanta din nou, se pune pe o tava de copt si se da la cuptor.

Făină

În exemplul de mai sus, elementul ingredient are două atribute: cantitate, care are valoarea 3, și unitate, care are valoarea sticla. Din punctul de vedere al marcajului XML, atributele de mai sus nu au nicio semnificație, ci sunt pur și simplu un set de caractere.

Pe lângă text, un element poate conține și alte elemente:

Se amestecă toate ingredientele și se frământă bine. Acoperiți cu o cârpă și lăsați o oră într-o cameră caldă. Se framanta din nou, se pune pe o tava de copt si se da la cuptor.

ÎN în acest caz, elementul „Instrucțiuni” conține trei elemente „pas”. XML nu permite suprapunerea elementelor. De exemplu, următorul fragment este incorect, deoarece elementele „em” și „puternic” se suprapun.

Comun accentuat evidențiate și accentuate dedicat

Fiecare document XML trebuie să conțină exact unul element rădăcină(element rădăcină sau element de document), astfel încât următorul fragment nu poate fi considerat un document XML valid.

Entitatea #1 Entitatea #2

A desemna un element fără conținut, numit element gol, necesar utilizați o formă specială de înregistrare constând dintr-o singură etichetă în care este plasată o bară oblică după numele elementului. Dacă un element nu este declarat gol în DTD, dar nu are conținut în document, pentru el permis utilizați această formă de înregistrare. De exemplu:

XML definește două metode de scriere a caracterelor speciale: referință la entitate și referință la caractere. Esență(entitate) în XML se referă la date numite, de obicei text, în special caractere speciale. Referință la entitate(referințe entități) este specificat în locul unde ar trebui să fie entitatea și constă dintr-un ampersand (“&”), numele entității și un punct și virgulă (“;”). Există mai multe entități predefinite în XML, cum ar fi „lt” (vă puteți referi la el scriind „< ») для левой угловой скобки и « amp » (ссылка - « & ») для амперсанда, возможно также определять собственные сущности. Помимо записи с помощью сущностей отдельных символов, их можно использовать для записи часто встречающихся текстовых блоков. Ниже приведён пример использования предопределённой сущности для избежания использования знака амперсанда в названии:

AT&T

Lista completă a entităților predefinite constă din & (“&”),< («<»), >(">"), " ("") și " ("") - ultimele două sunt utile pentru scrierea delimitatorilor în valorile atributelor. Vă puteți defini entitățile într-un document DTD.

Uneori este necesar să se definească un spațiu care nu se întrerupe, care este folosit foarte des în HTML și este indicat deoarece în XML nu există o astfel de entitate predefinită, este notat, iar utilizarea lui provoacă o eroare. Absența acestei entități foarte comune vine adesea ca o surpriză pentru mulți programatori, iar acest lucru creează unele dificultăți la migrarea dezvoltărilor lor HTML la XML.

Legătură prin număr simbol(referință de caractere numerice) arată ca o referință la o entitate, dar în loc de numele entității, este specificat caracterul # și un număr (în notație zecimală sau hexazecimală), care este numărul caracterului din tabelul de caractere Unicode. Acestea sunt de obicei caractere care nu pot fi codificate direct, cum ar fi o literă arabă într-un document codificat ASCII. Ampersand poate fi reprezentat astfel:

AT&T

Există mult mai multe reguli cu privire la crearea unui document XML valid, dar scopul acestuia prezentare scurta Era doar pentru a arăta elementele de bază necesare pentru a înțelege structura unui document XML.

Poveste

Anul nașterii XML poate fi considerat 1996, la sfârșitul căruia a apărut o versiune preliminară a specificației de limbă, sau când această specificație a fost aprobată. Totul a început odată cu apariția limbajului SGML în 1986.

SGML (Standard Generalized Markup Language) s-a declarat ca un meta-limbaj flexibil, cuprinzător și cuprinzător pentru crearea limbajelor de marcare. În ciuda faptului că conceptul de hipertext a apărut în 1965 (iar principiile care stau la baza au fost formulate în 1945), SGML nu are un model de hipertext. Crearea SGML poate fi numită cu încredere o încercare de a îmbrățișa imensitatea, deoarece combină capabilități care sunt extrem de rar utilizate împreună. Acesta este principalul său dezavantaj - complexitatea și, ca urmare, costul ridicat al acestui limbaj limitează utilizarea sa doar la companiile mari care își permit să cumpere software-ul adecvat și să angajeze specialiști bine plătiți. În plus, companiile mici au rareori probleme suficient de complexe pentru a implica SGML în rezolvarea lor.

SGML este cel mai utilizat pentru a crea alte limbaje de marcare, cu ajutorul acestuia a fost creat limbajul de marcare a documentelor hipertext - HTML, a cărui specificație a fost aprobată în 1992. Apariția sa a fost asociată cu nevoia de a organiza gama de documente în creștere rapidă pe Internet. Creșterea rapidă a numărului de conexiuni la Internet și, în consecință, a serverelor Web a dus la o astfel de nevoie de codare. documente electronice, căruia SGML nu a putut face față din cauza curbei sale mari de învățare. Apariția HTML, un limbaj de marcare foarte simplu, a rezolvat rapid această problemă: ușurința de învățare și multitudinea de instrumente de proiectare a documentelor l-au făcut cel mai popular limbaj pentru utilizatorii de internet. Dar, pe măsură ce numărul și calitatea documentelor de pe Web a crescut, la fel și cerințele impuse acestora, iar simplitatea HTML a devenit principalul său dezavantaj. Numărul limitat de etichete și indiferența totală față de structura documentului i-au determinat pe dezvoltatorii reprezentați de consorțiul W3C să creeze un limbaj de marcare care să nu fie la fel de complex precum SGML și nici la fel de primitiv ca HTML. Ca rezultat, combinând simplitatea HTML cu logica de marcare a SGML și satisfacerea cerințelor Internetului, a luat naștere XML.

Avantaje și dezavantaje

Avantaje

Defecte

  • Modelarea ambiguității.
  • XML nu are suport pentru tipul de date încorporat în limbaj. Nu are tastare puternică, adică conceptele de „întregi”, „șiruri”, „date”, „booleeni”, etc.
  • Modelul de date ierarhic oferit de XML este limitat în comparație cu modelul relațional și cu modelul de date de rețea și grafic orientat pe obiecte.

Afișarea XML pe World Wide Web

Cele mai comune trei moduri de a converti un document XML într-o formă afișată de utilizator sunt:

  1. Aplicarea stilurilor CSS;
  2. Aplicarea unei transformări XSLT;
  3. Scrierea unui handler de document XML în orice limbaj de programare.

Fără utilizarea CSS sau XSL, documentul XML apare ca text simplu în majoritatea browserelor Web. Unele browsere precum Internet Explorer, Mozilla și Mozilla Firefox afișează structura documentului într-o vizualizare arborescentă, permițându-vă să restrângeți și să extindeți nodurile cu clicuri de mouse.

Aplicarea stilurilor CSS

Procesul este similar cu aplicarea CSS unui document HTML pentru afișare.

Pentru a aplica CSS atunci când este afișat într-un browser, documentul XML trebuie să conțină un link specific către foaia de stil. De exemplu:

Aceasta este diferită de abordarea HTML, care utilizează elementul .

Aplicarea unei transformări XSLT

XSL este o tehnologie care descrie cum se formatează sau se transformă datele documentelor XML. Documentul este transformat într-un format adecvat pentru afișare într-un browser. Browserul este cea mai comună utilizare a XSL, dar nu uitați că cu XSL puteți transforma XML în orice format, de ex.

vPTYU fPVPFTBU

SGML: YUEN LFP EDSF?

uEZPDOS CHUE YUBEE NPTsOP CHUFTEFYFSH BVVTECHYBFHTH SGML. noPZIE CHYDSCH DPLHNEOFBGYY RPUFBCHMSAFUS CH ZHTNBFE SGML. rPRHMSTOSCHK SJSCHL TBNEFLY Web-UFTBOYG HTML SCHMSEFUS RTYMPTSEOYEN SGML. rPSCHMSEFUS CHUE VPMSHYE RTYLMBDOSH RTPZTBNN DMS TBVPFSCH U SGML: TEDBLFPTSCH, UTEDUFCHB ZHTNBFYTPCHBOYS, UYUFENSCH DPLHNEOFPPVPTPFB, YURPMSHQHAEYE SGML CH LBUEUFCHE ZhBoytpCHSgphsglphshKHULBAF Adobe, Corel, SoftQuad, Microsoft. h SGML ZPFPCHSFUS LOYZY YJDBFEMSHUFCHB O"Reilly, FEIOYUUEULBS DPLHNEOFBGYS IBM, Sun Y OSF. PUOPCHCHBEFUS DESPRE SGML YOZHTNBGYPOOBS FEIOMPZYS NOPZYI CHEDHAYI CHEDHAYI NBYOFBGY PUOPHY NYTB.

rPSCHYCHYBSUS CH OBYUBME CHPUSHNYDEUSFSHCHI SGML-FEIOPMPZYS RETETSYCHBEF UEKYUBU RETYPD TBUGCHEFB. YuFP LFP FBLPE? YuFP POB DBEF UCHPYN RPMSHЪPCHBFEMSN? lBL U OEK TBVPFBFS? DESPRE BFI Y DTHZIE CHPRPTUSCH CU RSHCHFBAUSH PFCHEFIFSH LFPC UFBFSHEK.

UPDETSBOYE





















lBL CU OBVTEM DESPRE SGML-FEIOPMPZYA

CHUE OBYUBMPUSH YOFTBOEFB. lFP NPDOPE UMPChP PBOBYUBMP DMS NEOS DESPRE RTBLFYLE FP, YuFP DPLHNEOFSHCH, LPFPTSCHE S TEZKHMSTOP RYUBM RP TPDH UCHPEK DESFEMSHOPUFY, UVBMP NPTsOP Y OHTsOP DEMBFSH "DPUFHROSCH". dP UYI RPT S RTPUFP OBVYTBM DPLKHNEOFSHCH T E X-e Y REYUBFBM YI DESPRE VKHNBZE. YDES DHVMYTPCHBFSH YI CH HTML CHTHYUOHA PFRBMB UTBH: OENEDMEOOOP CHPJOILMB VSC RTPVMENB UYOITPOYBGYY VKHNBTSOPK Y BMELFTPOOPK CHETUIK PDOPZP Y FPZP TSE DPLHNEOFB.

b CHULPTE RPFTEVPCHBMPUSH RETYPDYUEULBS RETEDBYUB DPLHNEOPCH RPUFPTPOOYN MADSN CH LMELFTPOOPC ZHTNE, YFP, RP UMPTSYCHYEKUS X OBU RTBLFYLE, POBYUBEF -- CH ZHTNBFE Microsoft Word. tBVPFBFSH Y MS Word X NEOS RP TSDH RTYUYO OE VSHMP OYLBLPZP TSEMBOYS, L FPNH TSE LFP FPMSHLP KHUHZHVYMP VSC RTPVMENKH UYOITPOYBGYY CHETUIK.

ъOBYUIF, OHTsOP VSHMP RTDKHNBFSH URPUPV BCHFPNBFYUEULPZP RTEPVTBBPCHBOYS OBVYTBENSHHI DPLKHNEOPCH CH TBMYUOSHE ZHTNBFSH: T E X-a -- DMS REYUBFY DESPRE VKHNBFY DESPRE VKHNBMS, - WWW U TBVPFBAEYNYH Windows. lTPNE FPZP, NOE IPFEMPUSH, YUFPVSH FBLPE UTEDUFChP PFCHEYUBMP EEE TSDH FTEVPCHBOYK:

  • VShchFSH NPDKHMSHOSCHN, YuFPVSH NPTsOP VSCHMP RTY OEPVIPDYNPUFY MEZLP DPVBCHMSFSH OPCHSHCHESCHSHCHIPDOSH ZHTNBFSH YMY YYNEOSFSH BMZPTYFNSCH RTEPVTBPBCHBOYS CH UKHEEUFCHHAEYE;
  • VShchFSH PFLTSCHFSHCHN, VEURMBFOSHCHN, LBL NPTsOP NEOSHYE RTYCHSBOOSHCHN L LPOLTEFOSCHN RTPZTBNNBN;
  • VShchFSH NPVYMSHOSHCHN: TBVPFBFSH, LBL NYOINKHN, DESPRE TBOSCH UNIX-RMBFZhPTNBI;
  • VSHFSH MEZLP TKHUIZHYYTHENSHN.

RETCHSHCHN, YuFP RPRBMPUSHNOE RPD THLH RPUME RPIPDB DESPRE Altavista, PLBBBMUS RBLEF RPD OBCHBOYEN linuxdoc-sgml. po LBL TBY RTEDOBOBYUBMUS DMS ZEOETBGYY HTML, T E X Y RTF YЪ PDOPZP CHIPDOZP ZhBKMB. yYTPL YURPMSHKHENSHCHK CH TBNLBI Linux Documentation Project, DE YURPMSHЪPCHBM CH LBYUEUFCHE CHIPDOZP ZHTNBFB OEBOBLPNSCHKNOE DP UYI RPT SJSHL SGML. chRTPYUEN, OYUEZP UMPTsOPZP CH OEN OE PLBBBMPUSH -- DE CHEUSHNB OBRPNIOBM OBLPNSCHKNOE HTML Y CHSHZMSDEM CHRPMOYE RPOSPHOP. chPF, L RTYNETH, LHUPYUEL SGML-DPLHNEOFB:

Structura unui text TEI

Toate textele conforme TEI conțin A Antet TEI(marcat ca a teiHeader element) și transcrierea textului propriu-zis (marcat ca a text element).

DMS FPZP, YuFPVSH OBYUBFSH DESPRE LFPN RYUBFSH, RPFTEVPPCHBMPUSH CHUEZP MYYSH OBRPNOYFSH OEULPMSHLP PUOPCHOSHI BMENEOFPCH TBNEFLY, OBRTYNET, YuFP

POBYUBEF OYUBMP RBTBZTBZHB, -- OBUBMP RETAILUYUMEOYS Y F.R.

oBVTBOOSCHK CH SGML FELUF DBMEE ЪBRHULPN PDOPZP ZHYMSHFTB RTEPVTBKHEFUS CH HTML, DTHZPZP -- CH T E X, FTEFSHEZP -- CH RTF, Y FBL DBMEE.

YuFP FBLPE SGML Y YuEN ON ITPPY

FETNYOPMPZYS

GML ( Limbajul de marcare generalizat) TTBTBVPFBO CH OEDTBI CHEDEUHEEK LPTRPTBGYY IBM. EZP OBUMEDOIL SGML ( Limbajul de marcare generalizat standard) RTYOSF CH 1986 ZPDH CH LBYUEUFCHE NETSDHOBTPDOPZP UFBODBTTFB DMS PRTEDEMEOYS OEBCHYUYNSHI PF KHUFTPKUFCH CHCHPDB/CHSHCHPDB, OEBCHYUYNSHI PF CHCHYUYUMYFEMSHOPDSHPCHUYUMYFEMSHOPDHUPCHUYNSHI PFUPCH PFOO ZHTNE. vPMEE FPYOP, SGML -- LFP NEFBSJL , FP EUFSH UTEDUFCHP ZHTNBMSHOPZP PRYUBOYS SJSHLB, CH DBOOPN UMHYUBE, SJSCHLB TBNEFLY .

yUFPTYYUEULY UMPchP TBNEFLB YURPMSHЪPCHBMPUSH DMS PRYUBOYK BOOPFBGYK YMY DTHZYI PVPOBYOOYK CHOKHFTY FELUFB, RTEDOBOBYOOOSHI DMS KHLBBOYK UPUFBCHYFEMA YMY "CHETUFBMSHAILH" FPZP, LBL YNEO OP OP. rTYNETSH CHLMAYUBAF RPDYUETLYCHBOYE CHPMOYUFPK YuETFPK, PVPOBYUBAEE LHTUYCH, UREGYBMSHOSHE OBYULY DMS RTPRKHULB ZHTB YMY YI REYUBFY LPOLTEFOSCHN YTYZhFPN, Y FBL DBMEE. lPZDB ZHTNBFYTPCHBOYE Y REYUBFSH FELUFPCH UFBMY BCHFPNBFYYTPCHBOOSCHNY, LFPF FETNYO UVBM PICHBFSHCHBFSH CHUE CHYDSCH UREGYBMSHOSHI LPDPCH TBNEFLY , CHUFBCHMSENSHI CH BMELFTPOOSCH FELUFSCH DMS HRTBCHMEOYS ZHTNBFYTPCHBOYEN, REYUBFSHHA YMY DTHZPK PVTBVPFLPK.

pVPVEBS, TBNEFLH, YMY LPDYTPCHLH , PRTEDEMSAF LBL MAVPE UTEDUFCHP UDEMBFSH SCHOSCHN YOFETRTEFBGYA FELUFB. DESPRE VBOBMSHOPN HTPCHOE CHUE OBREYUBFBOOSCH FELUFSCH LPDYTPCHBOSH CH LFPN UNSHUME: OBLY RTERYOBOYS, YURPMSHЪPCHBOYE ЪБЗМБЧОСЧИ ВХЛЧЧИ ВХЛЧЧИ ВХЛЧЧE YХЛЧЧББЧЧОСЧИ ВХЛЧЧE YХЛЧЧТFE, TBURMSH BMSH NETSDH UMPCHBNY NPTsOP UYUYFBFSH CH LBLPK-FP UFEREOY TBNEFLPK, JHOLGYS LPFPTPK -- RPNPYUSH YUEMPCHELH, YUYFBAEENKH FELUF, PRTEDEMYFSH, ZDE LPOYUBEFUS PDOP UMPChP Y OBUYOBEFUS DTHZPE, YMY LBL YDEOFYZHYGYTPCHBFSH PUPVEOOPUFY UFTHLFHTSCH, FBLYE LBL ЪBZPMPCHLY, YMY RTPUFSCHE UYOFBLYUYUEULYE EDYOYRPYTPCHBFSH PUPVEOOPUFY UFTHLFHTSCH, FBLYE LBL ЪBZPMPCHLY, YMY RTPUFSCHE UYOFBLYUYUEULYE EDYOFBLYUYUEULYE EDYOYRPYTPCHBFSH PUPVEOOPUFY UFTHLFHTSCH. lPDYTPCHBOYE FELUFB DMS LPNRSHAFETOPK PVTBVPFLY, CH RTYOGYRE, LBL TBUYYZHTPCHLB NBOKHULTYRFB U RETZBNEOFB, -- RTPGEUU DEMBOYS SCHOSCHN OESCHOPZP YMY RPDTBHNECHBENPHBZP, KHLBBJPHBZP, KLBTPHBZP TSOP YOFETRTEFYTPCHBFSHUS UPDETSINPE FELUFB.

rPD SЪSHLPN TBNEFLY RPOINBAF OBVPT UPZMBYEOYK P TBNEFLE, RTYNEOSENSHI DMS LPDYTPCHBOYS FELUFPCH. cu YUYF. SGML RTEDPUFBCHMSEF TEYEOYS DMS RETCHSCHI FTEI ЪBDБУ, PFDEMSHOBS DPLHNEOFBGYS PVSHYUOP OEPVIPDYNB DMS RPUMEDOEK.

pUPVEOOPUFY SGML

fTY IBTBLFETYUFYLY SGML PFMYUBAF EZP PF RTPYUYI SSHCHLPCH TBNEFLY.

prYUBFEMSHOBS TBNEFLB

uYUFENB U PRYUBFEMSHOPK TBNEFLPK YURPMSHЪHEF LPDSCH TBNEFLY, LPFPTSHCHE RTPUFP RTEDPUFBCHMSAF OBCHBOYS DMS LBFEZPTYBGYY YUBUFEK DPLHNEOFB. lPDSH TBNEFLY, FBLYE LBL YMY \end(list), RTPUFP YDEOFYZHYGYTHAF RPTGYA DPLHNEOFB Y KHFCHETTSDBAF, YuFP "POB SCHMSEFUS RBTBZTBZHPN", YMY YuFP "LFP - LPOEG RPUMEDOIN OBYUBFPZP URYULB" Y F.R. U DTHZPK UFPTPOSCH, UYUFENB U RTPGEDHTOPK TBNEFLPK PRTEDEMSEF, LBLBS PVTBVPFLB DPMTSOB CHSHRPMOSFSHUS CH LPOLTEFOPK FPYULE DPLHNEOFB: "CH LFPN NEUFE CHSHCHBFSH RTPGEDHTH PARA U RBOKNESH , "HF MYYY RBOKNEOFB" KH DESPRE 2NN MECHEE, RTBCHHA ZTBOYGH -- DESPRE 2NN RTBCHEE, RTPRKHUFYFSH PDOKH UFTPLH Y CHUFBFSH DESPRE OPCHHA MECHHA ZTBOYGKH" Y F.R. h SGML YOUFTHLGYY, OEPVIPDYNSCHE DMS PVTBVPFLY DPLHNEOFB U LBLPK-MYVP LPOLTEFOPK GEMSHA (OBRTYNET, DMS ZHTNBFYTPCHBOYS), YuEFLP PFDEMSAFUS PF PRYUBFEMSHOPK TBNEFLY, FPTBSCHUHFFEFY. pVSHYUOP POY UPVTBOSH CHOE DPLHNEOFB CH PFDEMSHOSHI RTPPGEDKHTBI YMY RTPZTBNNBI.

u PRYUBFEMSHOPK, B OE RTPGEDHTOPK, TBNEFLPK PDYO Y FPF TSE DPLHNEOF NPTsEF VSHFSH PVTBVPFBO TBOPPVTBOSCHNY RTPZTBNNBNY, LBTsDBS YJ LPFPTSCHI NPTsEF RTYNEOSFSH T BMYFTYUPFSY, LPVFTBVGPFY LPFYUPFLY PFPTSHCHE POB UYYFBEF CHBTTSOSCHNY. OBRTYNET, RTPZTBNNB BOBMYJB UPDETSYNPZP NPTSEF RPMOPUFSHA YZOPTYTPCHBFSH UPULY, FPZDB LBL RTPZTBNNB ZHTNBFYTPCHBOYS NPTSEF YICHMELBFSH Y UPVYTBFSH YI DMS RE YUBFSHPK LPO YUBFSHPK. TBMYUOSCHYODSH YOUFTHLGYK PVTBVPFLY NPZHF BUUPGYYTPCHBFSHUS U PDOPC Y FPK TSE YUBUFSHA ZHBKMB. OBRTYNET, PDOB RTPZTBNNB NPTSEF YICHMELBFSH YJ DPLHNEOFB ZHBNYMYY MADEK Y ZEPZTBZHYUEULYE OBCHBOYS DMS UP'DBOYS YODELUB YMY VBSHCH DBOSHI, FPZDB LBL DTHZBS , PVTBABVFTUBS , PVTBBVSCHFLUB FBFSH ZHBNYMYYY OBCHBOYS PFMYUBAEINUS YTYZhFPN.

fYRSH DPLHNEOFPCH

SGML CHCHPDYF RPOSFYE FYRB DPLHNEOFB ,Y,UPPFCHEFFUFCHOOOP, PRTEDEMEOYS FYRB DPLHNEOFB (definiție tip document, DTD). dPLHNEOFSH UYYFBAFUS FYRYYTPCHBOOSCHNY, FBL CE, LBL Y DTHZIE PVTBVBFSCHBENSHCHEN LPNRSHAFETBNY PVYAELFSHCH. fYR DPLHNEOFB ZHTNBMSHOP PRTEDEMSEFUS EZP UPUFBCHOSCHNY YUBUFSNY YI UFTHLFKHTPC. PRTEDEMEOYE, OBRTYNET, PFUEFB NPTSEF VSHFSH FBLYN, YuFP ON UPUFPYF YЪBZPMPCHLB Y, CHPNPTSOP, BCHFPTB, JB LPFPTSHNY UMEDHEF BOOPFBGYS Y RPUMEDPCHBFEMSHOPUFSH PDOPZ P YBMYGECHPMEEV P YBMYGECHPMEEV. mAVPK DPLHNEOF CH PFUKHFUFCHYE ЪBZPMPCHLB, CH UPPFCHEFUFCHYY U LFYN ZHTNBMSHOSHCHN PRTEDEMEOYEN, OE VKhDEF ZhPTNBMSHOP SCHMSFSHUS PFYUEFPN, FBL TSE LBL OE VKRPSCHFEUMSHFHBSH Y VKHDEFSHFBSHUS CH, JB LPFPTPK UMEDHEF BOOPFBGYS, OECHYTBS DESPRE FP, OBULPMSHLP RPIPTS DESPRE PFUEF FBLPK DPLHNEOF U FPYULY ЪTEOYS YUFBFEMS- YUEMPCHELB.

rPULPMSHLH DPLKHNEOFSH PFOPUSFUS L YYCHEUFOSCHN FYRBN, NPTsOP YURPMSHЪPCHBFSH UREGYBMSHOKHA RTPZTBNNH, OBSCHCHBENKHA BOBMYBFPTPPN (analizator), DMS FPZP, YUFPVSH PVTBVPFBFSH DPLHNEOF, KHFCHETTSDBAEIK, UFP PO PFOPUIFUS L LPOLTEFOPNH FYRH, Y RTPCHETYFSH, DEKUFCHYFEMSHOP MY CHUE BMENEOFSH, FTEVKHENSHCHE DMS OPFUPFUPCH YBOOPZFPUPCH, CHUEFUPCH, CHUEFUPCH BCHYMSHOPK RPUMEDPCHBFEMSHOPUFY. YuFP EEE VPMEE CHBTsOP, TBOSCH DPLHNEOFSH PDOPZP FYRB NPZHF PVTBVBFSHCHBFSHUS KHOIZHYGYTPCHBOOSCHN PVTBBPN. nPTsOP RYUBFSH VPMEE YOFEMMELPHBMSHOSCH RTPZTBNNSHCH, YURPMSHQHAEYE OBBOYS, ЪBLMAYUEOOSCH YOZHTNBGYPOOPK UFTHLFHTE DPLHNEOFB.

oEBCHYUINPUFSH DBOOSCHI

PUOPCHOBS GESH RTPELFYTPCHBOYS SGML VSHMB CH UPJDBOY ZBTBOFYK FPZP, YuFP DPLHNEOF, UBBLPDYTPCHBOOSCHK UPZMBUOP EZP RPMPTSEOYSN, VKDEF RETEOPUYNSCHN U PDOPK RTPZTBFOPK' DPLHNEOF UPZMBUOP ZHPTNBGYY. dChB EZP UCHPKUFCHB, PRYUBOOSCHI CHCHYE, PFCHEYUBAF LFPNH FTEVPCHBOYA DESPRE BVUFTBLFOPN HTPCHOE; FTEFSHE UCHPKUFChP -- DESPRE HTPCHOE UFTPYUEL VBKFPCH (UYNCHPMPCH), LPFPTSHCHE UPUFBCHMSAF DPLHNEOF. SGML RTEDPUFBCHMSEF PVPVEOOOSCHK NEIBOIN UFTPLPChPK RPDUFBOPCHLY , FP EUFSH, RTPUFPK NBYOOP-OEEBCHYUYNSCHK URPUPV KHLBBOYS, YuFP LPOLTEFOBS UFTPLB UYNCHPMPCH CH DPLKHNEOFE CH NPNEOF PVTBVPFLY DPLKHNEOFB DPMTSOB ЪBNEOSFSHPFSHUS UFTPLB UYNCHPMPCH CH DPLKHNEOFE CH NPNEOF PVTBVPFLY DPLKHNEOFB DPMTSOB ЪBNEOSFSHPFSHUS UFTHPLHTHZPT. pDOP PYUECHYDOPE RTYNEOOYE LFPNH NEIBOINH -- PVEUREYOOYE EDYOPK FETNYOPMPZYY; DTHZPE, Y VPMEE OBYUYFEMSHOPE, -- RTPFPYCHPDEKUFCHYE YJCHEUFOPK OEURPUPVOPUFY TBOSHI LPNRSHAFETOSHHI UYUFEN RPOINBFSH OBVPTSCH UYNCHPMPCH DTHZ DTHZB, OBRTYNET, PDOTYNETUCHUFFUCHUCHUFYULCH UPDUMYFUMCHUCHPMPCH SCH, OEPVIPDYNSCHE RTYMPTSEOYA, RHFEN PRYUBFEMSHOPZP PFPVTBTTSEOYS OERETEDDBCHBENSHI UYNCHPMPCH. uFTPLY, PRTEDEMSENSCHE LFYN NEIBOYNPN, OBSCCHBAFUS UHEOPUFSNY (entitati).

p RTEINHEEUFCHBI

YuFP DBEF YURPMSHЪPCHBOYE SGML CH TEBMSHOPK QYYOY? nu POP UTBKH DBMP CHPNPTSOPUFSH RTPYCHPDYFSH DPLKHNEOFSHCH MAVPN FTEVKHENPN CHYDE. xDPVOP PLBBBMPUSH Y OBRYUBOYE "ChPTDPCHSHCHI" VHNBTSEL CH RTYCHSHYUOPK UTEDE XEmacs VEЪ YURPMSHЪPCHBOYS Windows. CHUE YURPMSHЪPCHBOOSCH RTPZTBNNNSCH -- VEURMBFOSCH Y TBURTPUFTBOSAFUS CH YUIPDOSHI FELUFBI, YuFP RPЪCHPMYMP KHUFBOPCHYFSH YI DESPRE CHUEI YURPMSHKHENSHI NOK UYUFENBI. rTYUEN PLBBMPUSH, YuFP OBYUBFSH TBVPFBFSH U SGML CHCHUE OE UMPTsOP, LBTSDSCHK, LFP IPFSH TB TEDBLFYTPCHBM WWW UFTBOYULH, OE YURKHZBEFUS CHYDB LPOUFTHLGYK SGML.

rPFPN HCE, RP NETE RPUFEREOOPZP YHYUEOYS SGML, S PUPOBBM, YuFP LFB FEIOILB DBEF ZTPNBDOPE LPMYUEUFChP CHPNPTsOPUFEK RP UTBCHOOYA U FYRYUOPK "OBUFPMSHOPK FYRPZTBZH YEKRPZTBZH:

rTPDHLFYCHOPUFSH YuEFLP TBDEMEOOOSCH RTPGEUUSCH CHPDB YOZHPTNBGYY Y EE ​​​​ZHTNBFYTPCHBOYS RPJCHPMSAF BCHFPTKH UPUTEDPFPYYFSHUS DESPRE YIMPTSEOY NSHUMEK, OE PFCHMELBUSH DESPRE DCHYZBOYE FELUFBUPTHF YRPK.

edYOBS UFYMYUFYLB MEZLP CHSHCHDETTSYCHBFSH TBMYUOSCH DPLHNEOFSHCH EDIOPN UFYME, YURPMSHJHS EDYOKHA FETNYOPMPZYA. еUMY UFYMSH YMY FETNYOSCH OCHTSOP YЪNEOIFSH, LFP DEMBEFUS TBBPN PE CHUEI DPLHNEOFBI, OE FTPZBS YI UPDETSINPE.

rPCHFPTOPE YURPMSHЪPCHBOIEьФПФ FETNYO, ITPPYP OBBLPNSHCHK RTPZTBNNNYUFBN, POBYUBEF OBMYUYE CHPNPTsOPUFY YURPMSHЪPCHBFSH DEFBMY UFBTSCHI RTPELFPCH CH OPCHSHCHI, U NIOINBMSHOSCHNYYNEOOOSNY. yuBUFSH DPLHNEOFB, PZHTTNMEOOBS CH CHYDE SGML-BMENEOFB, NPTsEF RETEOPUIFSHUS CH DTHZIE DPLHNEOFSHCH, MEZLP RPCHFPTSFSHUS CH TBOSHI NEUFBI FELUFB.

dPMZPCHYUOPUFSH YOZHPTNBGYY yЪ-ЪB FPZP, YuFP SGML -- RTPUFPK Y UFBODBTFOSCHK ZHTNBF ITBOEOYS DBOOSCHI, PFUHFUFCHHEF OEPVIPDYNPUFSH RETEZHPTNBFYTPCHBFSH YI CHCHYDH HUFBTECHBOYS BRRBTBFTBFONNhOPMY RRBTBFTBNNhOPNSch. yOZhPTNBGYS RTPUFP DPUFHROB OCHUEZDB. pOB OUEEF U UPVPK CHUE OEPVIPDYNPE DMS UPJDBOYS DPLHNEOFB.

mHYUYYEE HRTBCHMEOYE DBOOSCHNY la SGML NPTsOP PRTEDEMSFSH YOZHPTNBGYPOOSCH BMENEOFSH Y NBOIRKHMSGYY U OINY U RTPYCHPMSHOPK UFEREOSHA DEFBMSHOPUFY. TBNEYOOOSCH BMENEOFSH NPZHF YNEFSH BFTYVKhFSH, PRTEDEMSAEYE IBTBLFETYUFYYY UCHPKUFCHB BMENEOFPCH. bFB YOZHPTNBGYS OE RTEDOBYEOB DMS REYUBFY, OP NPTSEF RPNPYUSH HRTBCHMEOYY BMENEOFBNY DBOOSCHI. OBRTYNET, BFTYVHF ID (YDEOFYZHYLBFPT) NPTSEF HOILBMSHOSCHN PVTBBPN YDEOFYZHYYTPCHBFSH PDYO BVBBG, YMY GEMSHCHK TBDEM, RTYNEYUBOIE, YMMAUFTBGYA, ЪF, LBDVBOYE BGYA, ЪF, LBDVBOYE B, CH

yOZhPTNBGYS
fBL LBL YDEOFYZHYLBFPTSCH SCHMSAFUS NBYOOP-YUYFBENSCHNY, POY NPZHF UCHSCHCHBFSH NETSDH UPVPK YOZHPTNBGYA Y YURPMSHЪPCHBFSHUS DMS TBOPPVTBOPZP KHRTBCHMEOYS EK. DESPRE:
  • lPOFTPMYTPCHBFSH VE'PRBUOPUFSH DPUFHRB L YOZHPTNBGYY, RPJCHPMSS FPMSHLP PRTEDEMEOOSCHN MADSN RTPUNBFTYCHBFSH YMY YNEOSFSH EE.
  • bChFPNBFYYTPCHBFSH RETENEEEEOOYE YOZHPTNBGYY -- OBRTYNET, PVPCHMEOYE DBOOSCHI CH PDOPN NEUFE NPTSEF YOYGYTPCHBFSH PVOPCHMEOYE FPK TSE YOZHPTNBGYY CH DTHZYI RTYMPTSEOYSI.

TBDEMSENPUFSH chPNPTSOPUFSH TBVPFSH UP UFTKHLFKHTYTPCHBOOSCHNY LPNRPEOFBNY DPLKHNEOFB RPJCHPMSEF UFTPYFSH GEMSHK DPLKHNEOF YI UPUFBCHOSHI YUBUFEK, TBVTPUBOOSCHI RP PTZBOYBGYY. lFP RPЪCHPMSEF RPMSHЪPCHBFEMSN DEMYFSHUS YOZHPTNBGYEK VEYE DHVMYTPCHBOYS.

nPVYMSHOPUFSH h YOZHPTNBGYPOOSCHI UEFSI, PVAEDYOSAEYI TBOPPVTBOSHE LPNRSHAFETSCH, PRETBGYPOOSHE UYUFENSH Y RTYMPTSEOYS, NPVYMSHOPUFSH UFBOPCHYFUS LMAYUPN LP CHUEPVEEK DPUFHROPUFYNBY. rPULPMSHLH SGML OE ЪBCHYUYF PF BRRBTBFHTSCH Y RTYMPTSEOYK, NPTsOP MEZLP PVNEOYCHBFSHUS DPLHNEOFBNY NETSDKH TBMYUOSCHNY UYUFENBNY.

ZYVLPUFSH H RTYMPTSEOYY SGML RPЪCHPMSEF YURPMSHЪPCHBFSH YOZHPTNBGYA DBMELP ЪB TBNLBNY "OBUFPMSHOPK FYRPZTBZHYY". DESPRE:

  • UFTBOYGSCH WWW;
  • YOZHPTNBGYPOOSHE VBSHCH DBOOSCHI;
  • DYBZOPUFYUEULYE / LURETFOSCH UYUFENSCH;
  • LMELFTPOOBS RPYUFB;
  • ZYRETFELUFPCHBS DPLHNEOFBGYS;
  • RHWMYLBYY DESPRE CD-ROM;
  • YOFETBLFYCHOSHE LMELFTPOOSHE NBOHBMSHCH.

rPYENH SGML?

rPYENH OE Word? rPFPNKH, YuFP LFP ЪBLTSCHFSHCHK ZHTNBF. rPFPNH, YuFP LFP ZhPTNBF PDOPZP RTYMPTSEOYS. rPFPNH, YuFP bFPZP RTYMPTSEOYS OEF RPD AOILUBNY, U LPFPTSCHNY S TBVPFBA. rPFPNKH, YuFP LFP OE FELUFPCHSHCHK ZHTNBF. rPFPNH, YuFP OEF UTEDUFCH BChFPNBFYUEULPK ZEOETBGYY FBLYI DPLHNEOFPCH. rPFPNH, YuFP OEF FPMLPCHSCHI UTEDUFCH HRTBCHMEOYS CHETUISNY Y LPMMELFYCHOPK TBVPFSHCH. rPFPNH, YuFP LFP ZhPTNBF TBNEFLY REYUBFY, B OE UNSHUMPCHPK UFTHLFKhTSCH, Y OEF CHPNPTSOPUFY YI UPPFOPUYFSH. rPFPNH, YuFP RTY LURPTFFE RPMHYUBEFUS UPCHETYYOOOP OEHDPCHMEFCHPTYFEMSHOSHCHK HTML. rPFPNH, YuFP LBYUEUFChP CHETUFLY Y REYUBFY OJCE UTEDODOEZP.

rPYENH OE T E X? rPFPNKH, YuFP LFP UMYILPN OYLPHTPCHOECHSHCHK SJSHL. EZP OE DBYSH CH THLY OBUYOBAYENKH. rPFPNH, YuFP LFP ZhPTNBF TBNEFLY REYUBFY, B OE UNSHUMPCHPK UFTHHLFKhTSCH . rPFPNH, YuFP NBMP T E X-PTYEOFYTPCHBOOSCHI TEDBLFPTPCH. rPFPNH, YuFP OEF KHDCHMEFCHPTYFEMSHOSHHI UTEDUFCH LURPTFB H Cuvânt.

rPYENH OE HTML? rPFPNKH, YuFP UBNP RPOSFYE HTML UYMSHOP TBBNSHFP ZPOLPK WWW ЪБ LPNNETGYEK Y CHPKOK RTPYCHPDYFEMEC VTBHJETPCH DTHZ U DTHZPN. rPFPNH, YuFP HTML UFTBDBEF CHUE FEN TSE OEDPUFBFLPN: PTYEOFYTPCHBO DESPRE RTEDUFBCHMEOYE, B OE DESPRE UFTHLFHTH. rPFPNKH, YuFP PO PUEOSH VEDEO CHSTBIFEMSHOSHNY UTEDUFCHBNY, Y PFUKHFUFCHHAF CHNPTSOPUFY EZP TBUYYTEOYS. rPFPNH, YuFP OE TEYEOB RTPVMENB LPTTELFOPK TKHUIZHYLBGYY. rPFPNH, YuFP OEF KHDCHMEFCHPTYFEMSHOSHHI UTEDUFCH LURPTFB H Cuvânt.

SGML RTPFPYCH WYSIWYG

dMS FAIRIES, LFP RTYCHSHL RPMSHЪPCHBFSHUS FPMSHLP „procesor de text”-BNY, OBRTYNET, MS Word YMY WordPerfect, NPTsEF VSHCHFSH YOFETEUOP UPRPUFBCHMEOYE YI U SGML YOUFTHNEOFBNY. Fe ven Ztkhrrsch RTPZTBNESHSHNA DEDUFCH, OEUNPFTS pe WIPCEUFSH Teybenshchi Kommersantbu - RTPYCHPDUFCHP DPLHNEOFPCH - Cheushnb DHZD DHUZB PFMYYUBAFUS RP Btifelefhy Zholgysn.

Procesor de text -- LFP YOFEMMELPHHBMSHOBS RYYHEBS NBYYOLB. PE PTYEOFYTPCHBO DESPRE TBVPFH U CHYHBMSHOSCHN RTEDUFBCHMEOYEN FELUFB, IBTBLFETYYHAEEZPUS OBVPTPN UFYMEK: UFYMEK UYNCHPMPCH (YTYZhF, LEZMSH, OBUETFBOYE), BVBGETYYHAEEZPUS OBVPTPN UFYMEK YTYOE UFTBOYGSHCH), UFTBOYG (LPMPOFYFKHMSHCH, UOPULY), TBDEMPCH Y DPLHNEOPCH (ZHTNBF VKHNBZY , PZMBCHMEOYE), Y RTPYUYI. Procesor de text OE TBVPFBEF U CHOKHFTEOOEK UFTKHLFKHTPK DPLKHNEOFB.

SGML TEDBLFPT, OBRTPFYCH, PTYEOFYTPCHBO DESPRE TBVPFH UPDETTSYNSCHN DPLHNEOFB. dMS SGML TEDBLFPTB, OBRTYNET, TBDEM -- LFP BMENEOF, CH LPFPTSCHK NPZHF CHLMAYUBFSHUS RPDTBBDEMSH, BOE RTPNETSKHFPL PF PDOPZP BVBGB, OBVTBOOPZP UFYMEN "bZPMPCHPL" procesor de cuvinte LDPa VPHIZPr.

ьФП РПЪЧПМСЭФ БЧФПТХ UPUTEDPFPYUFSHUS DESPRE UPDETSBOY FELUFB, BOE CHPJIFSHUS U EZP ZHTNBFYTPCHBOYEN Y CHSHCHVPTPN UFYMEK. chYHBMSHOBS UFYMYUFYLB DPLHNEOFB PRTEDEMSEFUS RTY EZP LURPTFFE CH CHCHPDOSH ZHTNBFSHCH, B OE RTY OBVPTE FELUFB.

p RTPZTBNNOPN PVEUREYUEOOYY

YuFPVSH OBYUBFSH TBVPFBFSH U DPLHNEOFBNY CH SGML RPMSHЪPCHBFEMA OHTSOSCH DCHB PUOPCHOSHI UTEDUFCHB: TEDBLFPT Y UTEDUFCHB LURPTFB (ZHTNBFYTPCHBOYS).

SGML-TEDBLFPT

SGML-TEDBLFPT PFMYUBEFUS LBL PF RTYCHSHCHYUSHI FELUFPCHSCHI TEDBLFPTPCH, FBL Y PF „procesor de text” -PC. pF RETCHSHCHI -- OBMYUYEN RPDDETSLY UFTHLFHTYTPCHBOOSCHI DPLHNEOPCH, PF CHFPTSCHI -- PFUHFUFCHYEN RPDDETSLY CHYHBMSHOPZP ZHTNBFYTPCHBOYS. TEDBLFPT TBYTBEF DTD TEDBLFYTHENPZP DPLHNEOFB Y "CHEDEF" RPMSHЪPCHBFEMS CH UPPFCHEFUFCHYY U OIN. OBRTYNET, EUMY DTD RTEDHUNBFTYCHBEF BMENEOF

, Ch LPFPTPN NPZHF CHUFTEYUBFSHUS FPMSHLP BMENEOFSH YMY , FP RPMSHЪPCHBFEMA, TEDBLFYTHAENKH BMENEOF
, VKhDEF RTEDMPTSEOP CHUFBCHYFSH PDYO YЪ LFYI DCHHI TBTEOOOSCHI BMENEOFPC. SGML-TEDBLFPT FBLCE PVSHYUOP UPDETTSYF UTEDUFCHB OBCHYZBGYY RP YETBTIYY DPLHNEOF.

yYYUMB RPRKHMSTOSCHI SGML-TEDBLFPTPCH NPTsOP OBCHBFSH ArborText ADEPT*Editor, SoftQuad Autor/Editor, psgml, Adobe FrameMaker+SGML, Corel WordPerfect, Y NOPCEUFChP DTHZYI.

uTEDUFCHB ZHTNBFYTPCHBOYS

uHEEUFCHHEF NOPTSEUFCHP UTEDUFCH TBVPFSCH U SGML FELUFBNY. VOMSHYKHA YI YUBUFSH UPUFBCHMSAF UTEDUFCHB ZHTNBFYTPCHBOYS -- LURPTFB SGML CH DTHZIE ZHTNBFSH DMS REYUBFY, RTPUNPFTB Y F.R. CHSHCHIPDOSH ZHPTNBFSH NPZHF VSCHFSH MAVSHNY, ЪBCHYUS MYYSH PF DPUFKHROPZP RTPZTBNNOPZP PVEUREYUEOYS Y OHTSD RPMSHЪPCHBFEMS. OBRTYNET, S YURPMSHYHA LPOCHETFETSHCH HTML, RTF Y L A T E X.


Limbaje de marcare: SGML, HTML, XML. Legătura lor unul cu celălalt.

HTML a fost inițial doar o aplicație SGML. El a descris regulile prin care informațiile ar trebui să fie pregătite pentru World Wide Web. Astfel, HTML este un set de instrucțiuni SGML, formulate ca o definiție a tipului de document (DTD), care explică ce înseamnă etichetele și elementele. Schema HTML DTD este stocată în browserul web.

Astfel, pe de o parte, limbajul HTML este un mijloc foarte convenabil de marcare a documentelor pentru utilizare pe Web, iar pe de altă parte, un document marcat în HTML are puține informații despre conținutul său. Dacă un anumit document conține informații suficient de complete despre conținutul său, devine posibil să se efectueze procesare și căutare generalizată automată în fișierul care stochează documentul relativ ușor. SGML vă permite să stocați informații despre conținutul unui document, dar datorită complexității sale, acesta nu a fost niciodată utilizat la fel de larg ca HTML.

Un grup de experți SGML, condus de Jon Bosak de la Sun Microsystems, a început să lucreze pentru a crea un subset de SGML care ar putea fi adoptat de comunitatea web. S-a decis eliminarea multor caracteristici neesențiale ale SGML. Limbajul reconstruit în acest fel a fost numit XML. Versiunea simplificată a fost semnificativ mai accesibilă decât originalul, specificațiile sale având doar 26 de pagini, față de cele peste 500 de pagini ale specificațiilor SGML.

Avantajele limbajului XML.

  • Suporta Unicode.
  • Platforma independenta;

Servicii web

serviciu web(serviciu web) - un sistem software care are un URI și ale cărui interfețe publice sunt definite în XML. Descrierea acestui sistem software poate fi găsită de alte aplicații, care pot interacționa cu acesta în conformitate cu această descriere prin mesaje bazate pe XML transmise folosind protocoale Internet. Un serviciu web este o unitate de modularitate atunci când este utilizat Arhitectura orientată spre servicii aplicatii.

Arhitectura orientată spre servicii(SOA, arhitectură orientată pe servicii) este o abordare modulară a dezvoltării software bazată pe utilizarea serviciilor cu interfețe standardizate.

SOA se bazează pe principiile reutilizarii elementelor funcționale IT și unificării proceselor operaționale standard. Componentele programului pot fi distribuite pe diferite noduri de rețea și sunt oferite ca servicii de aplicații independente și ușor cuplate, înlocuibile.

Interfața componentelor unui program SOA încapsulează detaliile de implementare ale unei anumite componente (OS, limbaj de programare etc.).

Serviciile web .NET au următoarele avantaje:

  • Deschiderea standardelor. Nu există elemente ascunse sau inaccesibile în serviciile web. Fiecare aspect al tehnologiei, de la modul în care este găsit un serviciu web la modul în care este descris și cum comunică, este definit de standarde disponibile publicului.
  • Multiplatformă. Un limbaj de programare care vă permite să creați documente XML și să trimiteți informații prin HTTP, permițându-vă să interacționați cu orice serviciu web. Este posibil să primiți un serviciu web de la un alt sistem decât .NET.
  • Simplitate.
  • Suport mesaje într-un limbaj care poate fi citit de om. Tranziția de la standardele binare utilizate în COM și CORBA la textul XML a facilitat corectarea erorilor și a oferit posibilitatea de a interacționa cu serviciile web prin canale HTTP obișnuite.

Implementarea serviciilor web .NET este la fel de simplă ca invocarea unui serviciu web la distanță sau apelarea unei metode de clasă locală. Acest lucru se realizează prin utilizarea instrumentelor oferite de .NET Framework, care vă permit să creați un serviciu web complet fără a fi nevoie să aflați detaliile despre cum funcționează standardele precum SOAP, WSDL și UDDI. În acest caz, se efectuează următoarele acțiuni:

  1. Un serviciu web este dezvoltat ca o clasă .NET cu atribute care îl identifică ca un serviciu web cu anumite funcționalități.
  2. .NET generează automat un document WSDL care descrie modul în care clientul ar trebui să interacționeze cu serviciul web.
  3. Consumatorul găsește serviciul web creat și poate adăuga referința web corespunzătoare la proiectul Visual Studio .NET.
  4. .NET validează automat documentul WSDL și generează o clasă proxy care permite consumatorului să interacționeze cu serviciul web.
  5. Consumatorul apelează una dintre metodele clasei dvs. de servicii web. Din punctul său de vedere, acest apel nu diferă în aparență de apelarea unei metode în orice altă clasă, deși interacțiunea este de fapt cu clasa proxy, și nu cu serviciul web.
  6. Clasa proxy convertește parametrii trecuți într-un mesaj SOAP și îl trimite către serviciul web.
  7. Clasa proxy primește apoi răspunsul SOAP, îl convertește la tipul de date corespunzător și îl returnează ca tip de date .NET obișnuit.
  8. Consumatorul folosește datele primite.

Serviciile web .NET utilizează tehnologia ASP .NET, care face parte din .NET Framework. De asemenea, necesită suport de la serverul Microsoft IIS.

Principalele dezavantaje ale serviciilor web sunt performanța mai scăzută și traficul de rețea mai mare în comparație cu tehnologii precum RMI, CORBA, DCOM datorită utilizării mesajelor text XML.

Standarde pentru servicii web.

Specificația WSDL

Fiecare serviciu web oferă un document WSDL (Web Service Description Language) care descrie tot ce are nevoie clientul pentru a lucra cu acest serviciu. Un document WSDL oferă un mod simplu și consistent pentru un dezvoltator de a specifica sintaxa pentru apelarea oricărei metode Web. Mai mult, acest document vă permite să utilizați instrumente pentru generarea automată a claselor proxy, cum ar fi cele incluse în mediile Visual Studio .NET și .NET Framework. Datorită acestor instrumente, utilizarea unui serviciu web este la fel de ușoară ca și utilizarea unei clase locale.

Un document WSDL are un format bazat pe XML care împarte informațiile în cinci grupuri. Primele trei grupuri sunt definiții abstracte care sunt independente de specificul platformei, rețelei sau limbii, în timp ce celelalte două grupuri includ descrieri specifice.

Protocolul SOAP

Comunicarea între serviciile web și clienții acestora se realizează prin mesaje în format XML.

SOAP (Simple Object Access Protocol) este un protocol de mesaje pentru selectarea serviciilor web.

Ideea principală a standardului SOAP este că mesajele ar trebui să fie codificate într-un format XML standardizat.

Pe lângă mesajele SOAP, puteți utiliza metodele GET și POST ale protocolului HTTP pentru a face schimb de date cu serviciile .NET.

Avantajele utilizării formatului SOAP față de alte formate pentru transferul de date:

  • Codificarea structurilor de date și a seturilor de date în XML folosind SOAP este la fel de ușoară ca și codificarea unor tipuri de date scalare simple.
  • Când utilizați mesaje SOAP, sunt furnizate instrumente suplimentare pentru a facilita adăugarea de funcții de securitate sau de urmărire, de exemplu.
  • Există seturi de instrumente SOAP pentru diferite limbaje de programare (și chiar și pentru versiunile anterioare ale Microsoft C++ și Visual Basic). În caz contrar, pentru a comunica cu serviciul folosind metodele GET și POST ale protocolului HTTP, va trebui evident să construiți singur șirul de interogare și apoi să analizați răspunsul.

Standard DISCO

Standardul DISCO oferă cea mai simplă modalitate de a accesa fișierele manifest, permițându-vă să grupați referințe la serviciile web.

Un fișier DISCO poate include fișiere de pe diverse servere web și acceptă „căutare dinamică” - căutarea automată a unui director de fișiere de servicii web de pe server.

Fișierele manifest sunt utile deoarece combină mai multe servicii web într-o singură listă, dar nu permit clienților să caute un anumit tip de serviciu web fără a specifica numele companiei care l-a dezvoltat.

Specificația UDDI

Specificația UDDI (Descriere universală, descoperire și integrare) evită aceste probleme prin utilizarea unui depozit special (depozit) în care întreprinderile și organizațiile pot plasa date despre serviciile pe care le oferă. Peste 100 de companii au inițiat crearea tehnologiei UDDI ( lista plina poate fi găsit la http://www.uddi.org/community.html), inclusiv Sun și Microsoft. Prin unirea forțelor, aceste companii au dezvoltat un proiect de specificație UDDI, care a fost standardizat după 18 luni.

Informațiile din acest depozit trebuie actualizate manual. În acest scop, unii „operatori de noduri” mențin copii identice ale depozitului UDDI. Aceste companii oferă stocarea depozitului specificat și acces gratuit la acesta pentru a populariza serviciile web. În plus, Microsoft a inclus o versiune de UDDI în software server Windows.NET pentru utilizare pe intraneturile corporative.

Magazinul UDDI conține informații despre întreprinderile care furnizează servicii web, tipul fiecărui serviciu și relațiile cu informațiile și specificațiile legate de aceste servicii. Interfața UDDI în sine este un serviciu web. Pentru a vă înregistra sau a căuta un serviciu, trebuie să trimiteți un mesaj SOAP.

WEB - integrare.

Scopul integrării web este de a combina aplicații și sisteme web disparate într-un singur mediu web.

Sunt practicate următoarele abordări ale integrării web:

· Integrare la nivel de prezentare. Acest strat permite utilizatorului să interacționeze cu aplicația. Integrarea la nivel de prezentare dă acces la interfața de utilizator a aplicațiilor de la distanță.

· Integrare la nivel de funcționalitate. Această integrare implică furnizarea de acces direct la logica de afaceri a aplicației. Acest lucru se realizează prin interacțiunea directă între aplicații și API(interfață de programare a aplicației) sau interacțiune prin servicii web.

· Integrare la nivel de date. În acest caz, acces la unul sau mai multe baze de date, utilizat de aplicația de la distanță.

· Integrare cuprinzătoare. Soluțiile comerciale de integrare web includ de obicei toate cele trei tipuri de integrare

Utilizarea integrării web este benefică din mai multe motive:

· Integrare web vă permite să implementați sisteme de informații bazate pe aplicații terțe fără a fi nevoie să înțelegeți sistemele părinte, mediile software și arhitecturile bazelor de date.

· SOAȘi servicii web utilizați un limbaj de programare și interfețe independente de platformă între aplicațiile infrastructurii IT corporative. Acest lucru oferă avantaje evidente în sprijinul, gestionabilitatea și implementarea rețelelor de informații.

· Integrarea web vă permite să construiți funcționalități complexe prin combinarea componentelor disparate prin protocoale de servicii web.

· Integrarea web vă permite să utilizați serviciile web pentru dezvoltatori.

· Integrarea web vă permite să dezvoltați interfețe de programe de aplicații prin protocoale de servicii web fără programare.

Pentru integrarea web, se folosesc de obicei software comercial sau tehnologii populare, cum ar fi PHP/Python/Perl, XForms, SĂPUN etc.

Integrare bazată pe XML

În loc să implementați interacțiunea între fiecare pereche de sisteme, trebuie doar să-i învățați pe fiecare dintre ele să „vorbească” XML. Cu alte cuvinte, totul se reduce la dezvoltarea mai multor ambalaje (wrapper este un wrapper, un instrument software pentru crearea unui shell de sistem pentru standardizarea apelurilor externe și schimbarea orientării funcționale a sistemului existent), care se va traduce din limbajul XML standard al sistemului integrat într-un limbaj ușor de înțeles pentru fiecare sistem individual.

· instrumente de dezvoltare și biblioteci standard pentru XML există pe aproape toate platformele și pentru cele mai populare limbaje de programare;

· metodele de lucru cu XML sunt suficient de standard pentru sisteme diferite a fost posibil să se folosească aceleași tehnici;

· informațiile formatate în XML pot fi procesate nu numai de mașini, ci și de oameni (ceea ce face depanarea mult mai ușoară).

În principiu, integrarea bazată pe o schemă XML nu este fundamental diferită de integrarea bazată pe orice alt standard comun. În același timp, are o serie de avantaje semnificative:

· Limbile XML nu depind de platformele hardware și software, ceea ce permite conectarea sistemelor diferite;

· puterea expresivă a XML-ului este suficient de mare pentru a descrie date de aproape orice complexitate;

Integrarea bazată pe XML este practic implementată în cadrul următoarelor protocoale:

· XML-RPC. Acesta este un protocol de apel de procedură la distanță cu transmisie de date în format XML prin portul TCP 80, de exemplu. Port HTTP.

· WDDX(Schimb distribuit web). Este un mecanism pentru schimbul de structuri complexe de date prin protocolul HTTP. Protocolul nu se bazează pe structuri, ci pe evenimente.

· ebXML(electronic business XML) – XML pentru afaceri electronice. Scopul principal este de a oferi o infrastructură XML deschisă care să asigure utilizarea globală sigură a informațiilor de e-business. Servicii web (servicii web).

XML (eXtensibleMarkupLanguage) este un limbaj de marcare recomandat de W3C. XML este un format de text conceput pentru stocarea datelor structurate, pentru schimbul de informații între programe și, de asemenea, pentru crearea de limbaje de marcare specializate pe baza acestuia. XML este un subset simplificat al limbajului SGML .

Limbajul XML are următoarele demnitate:

  • Acesta este un format de document orientat spre om, este de înțeles atât pentru oameni, cât și pentru computere.
  • Suporta Unicode.
  • Formatul XML poate descrie structuri de date de bază, cum ar fi înregistrări, liste și arbori.
  • Este un format de auto-documentare care descrie structura și numele câmpurilor, precum și valorile câmpurilor.
  • Are cerințe de sintaxă și analiză strict definite, ceea ce îi permite să rămână simplu, eficient și consecvent.
  • Folosit pe scară largă pentru stocarea și procesarea documentelor;
  • Acesta este un format bazat pe standarde internaționale;
  • Structura ierarhică a XML este potrivită pentru a descrie aproape orice tip de document;
  • Este un text simplu, lipsit de licențe și orice restricții;
  • Platforma independenta;
  • Este un subset al SGML pentru care s-a acumulat o vastă experiență și au fost create aplicații specializate;

La faimos neajunsuri limbile includ următoarele:

· Sintaxa XML este redundantă.

· Dimensiunea unui document XML este semnificativ mai mare decât reprezentarea binară a acelorași date.

· Dimensiunea unui document XML este semnificativ mai mare decât cea a formatelor alternative de transfer de date bazate pe text (de exemplu, JSON, YAML) și în special formatelor de date optimizate pentru un anumit caz de utilizare.

· Redundanța XML poate afecta performanța aplicației. Costul stocării, procesării și transmiterii datelor este în creștere.

· Pentru un număr mare de sarcini, nu este necesară întreaga putere a sintaxei XML și pot fi utilizate soluții mult mai simple și mai productive.

  • Spațiile de nume XML sunt dificil de utilizat și greu de implementat în parsere XML.
  • XML nu are suport pentru tipul de date încorporat în limbaj. Nu are conceptele de „întregi”, „șiruri”, „date”, „booleeni”, etc.
  • Modelul de date ierarhic oferit de XML este limitat în comparație cu modelul relațional și graficele orientate pe obiecte.

În esență, XML servește metalimbaj pentru a descrie structura altor limbi. Relația dintre SGML, XML, HTML și alte limbi este prezentată în următoarea diagramă:

O diferență importantă între XML și HTML este marea atenție acordată monitorizării cât de exact sunt respectate regulile limbajului la marcarea documentelor. În funcție de aceasta, se obișnuiește să se facă distincție corect construitȘi valabil documente XML .

Se consideră un document XML construită corespunzător, dacă se potrivește cu toate regulile de sintaxă XML.

Examinare realitate document presupune realizarea urmatoarelor actiuni:

  • Verifică dacă este utilizat doar un anumit set de descriptori.
  • Verificarea conformității complete a ordinii elementelor și atributelor cu conținutul documentului sau cu anumite reguli.
  • Controlul tipului de date (realizat prin utilizarea unei scheme adecvate).
  • Controlul integrității datelor pentru a asigura schimbul optim de informații prin intermediul Web-ului folosind tranzacții.

Reguli de sintaxă de bază construirea de documente XML.

  • Documentul XML conține unul și numai unul element rădăcină conţinând toate celelalte elemente
  • Elemente copil cuprins în element rădăcină, trebuie să fie imbricate corect.
  • Nume elementele respectă regulile:
  • Numele începe cu o literă, liniuță de subliniere sau două puncte.
  • După primul caracter din nume pot fi litere, cifre, cratime, caractere de subliniere, punct sau două puncte.
  • Numele nu pot începe cu o combinație de litere XML.

Documentul XML are următoarea structură:

  • Prima linie a documentului XML este apelată anunţ XML. Acesta este un șir opțional care indică versiunea standardului XML (de obicei 1.0). Codificarea caracterelor și dependențele externe pot fi, de asemenea, specificate aici.

SGML(Engleză: Standard Generalized Markup Language - limbaj standard de marcare generalizat; pronunțat [s-ji-em-el]) - un meta-limbaj în care puteți defini un limbaj de marcare pentru documente. SGML este succesorul GML (Generalized Markup Language) dezvoltat în 1969 la IBM, care nu trebuie confundat cu Geography Markup Language dezvoltat de Open GIS Consortium.

SGML a fost dezvoltat inițial pentru partajarea documentelor care pot fi citite de mașini în proiecte mari guvernamentale și aerospațiale. A fost utilizat pe scară largă în industriile tipărite și editoriale, dar complexitatea sa a făcut dificilă adoptarea pe scară largă pentru utilizarea de zi cu zi.

Principalele părți ale documentului SGML:

Declarație SGML - definește ce caractere și delimitatori pot apărea în aplicație;

Definiție tip document - definește sintaxa constructelor de marcare. DTD poate include definiții suplimentare, cum ar fi referințe simbolice;

Specificația semantică, care se referă la marcaj, oferă, de asemenea, restricții de sintaxă care nu pot fi exprimate într-un DTD;

Conținutul documentului SGML - cel puțin trebuie să existe un element rădăcină.

SGML oferă o varietate de opțiuni de marcare sintactică pentru utilizare de către o varietate de aplicații. Schimbând declarația SGML, puteți chiar să renunțați la utilizarea parantezelor unghiulare, deși această sintaxă este considerată standard, așa-numita sintaxă de referință concretă.

Exemplu de sintaxă SGML:

de obicei ceva de genul acest

SGML este standardizat de ISO: „ISO 8879:1986 Procesarea informațiilor-Text și sisteme de birou-Standard Generalized Markup Language (SGML)”

HTML și XML sunt derivate din SGML. HTML este o aplicație a SGML, iar XML este un subset al SGML conceput pentru a simplifica procesul de parsare automată a unui document. Alte aplicații SGML sunt SGML Docbook (documentație) și „Z Format” (tipografie și documentație).

XML- Extensible Markup Language, adică Extensible Markup Language, a apărut ca urmare a dezvoltării limbajului HTML (HyperText Markup Language, hypertext markup language). Cu toate acestea, ar fi o greșeală gravă să îl percepem doar ca o versiune îmbunătățită a limbajului HTML. În esență, XML este o nouă generație de limbaje de marcare. Aici ar trebui să aveți în vedere 3 puncte care disting în mod fundamental XML de HTML și predecesorii săi (GML - Generalized Markup Language, SGML - Standard General Markup Language):

XML, spre deosebire de HTML, NU ARE ETICHETE PREDEFINITE – mai exact, fiecare dezvoltator își poate crea PROPRIILE tag-uri XML – câte este nevoie. Numărul de astfel de etichete este practic nelimitat. Astfel, XML este un metalimbaj care permite crearea altor limbaje de marcare, precum HTML.

Pe măsură ce limbajul HTML a evoluat, numărul de etichete a crescut rapid. În cele din urmă, numărul lor a atins o „valoare critică” - a devenit dificil pentru dezvoltatorii de documente web să-și amintească din ce în ce mai multe etichete noi, dar dezvoltatorii de browsere s-au găsit într-o poziție și mai proastă - au fost nevoiți să creeze noi versiuni de browsere care să „înțeleagă” etichete noi. Browserele mai inteligente devin, de asemenea, mai mari în dimensiune și impun cerințe din ce în ce mai mari pentru computerele pe care sunt utilizate. Problema este agravată de faptul că recent dispozitivele portabile au devenit din ce în ce mai populare (în special, sunt din ce în ce mai utilizate în comerțul electronic), cu memorie limitată și ecrane „slabe” și, prin urmare, browserele utilizate pe ele au posibilități foarte limitate. . XML, care nu are un sistem de etichete predefinit, rezolvă această problemă. „Plata” pentru versatilitate este o mai mare rigoare în proiectarea documentelor web. Regulile pentru formatarea documentelor XML sunt simple:

Containerele de etichete neînchise nu sunt permise (dar puteți combina etichetele de deschidere și de închidere într-una singură, de exemplu:
)

containerele „cuibări” nu se pot „suprapune”

literele mici și mari sunt tratate ca caractere diferite

Cuvintele cheie nu pot fi folosite ca nume de etichetă

Nu puteți utiliza spații, semne de punctuație, paranteze rotunde, pătrate sau ondulate în numele etichetelor

Literul de subliniere (_) și numerele pot apărea în etichete, dar un număr nu poate fi primul caracter al unui nume de etichetă

(Dacă trebuie să utilizați mai multe cuvinte ca nume de etichetă, acestea ar trebui scrise împreună, începând fiecare cuvânt cu o literă majusculă.)

Documentele care îndeplinesc aceste reguli se numesc documente bine formate.

XML este folosit pentru DESCRIEREA STRUCTURILOR DE DATE, în principal STRUCTURILE IERARHICE.

Una dintre principalele tendințe în dezvoltarea tehnologiilor web este SEPARAREA DATELOR, STRUCTURA DOCUMENTULUI ȘI DESIGNUL ȘI STILULUI. După cum știți, una dintre modalitățile de a separa datele din structura documentului este de a lega dinamic DBMS-ul cu documentele web prin interfața ODBC (Open DataBase Connectivity). Separarea stilurilor se realizează prin utilizarea foilor de stil în cascadă. XML vă permite să descrieți baze de date non-relaționale. Deoarece etichetele pot fi create de dezvoltator, numele lor descriu de obicei semnificația datelor.

XML, ca mijloc de descriere a structurii datelor, oferă SCHIMB DE DATE între diferite aplicații, acționând astfel ca un fel de „clei”.

Importanța acestei funcții XML „clei” nu poate fi exagerată. Datorită capacității de a face schimb de date între diverse aplicații, tehnologiile web „ating” un nivel cu totul nou.

HipertextMarkupLimba (HTML) este un sistem simplu de creare a documentelor hipertext care sunt portabile de la o platformă la alta. În esență, documentele HTML sunt documente SGML cu o semantică comună care sunt potrivite pentru reprezentarea informațiilor într-o gamă largă de aplicații. HTML poate fi folosit pentru a reprezenta:

    Știri hipertext, corespondență, documentație și hipermedia

    Meniul Opțiuni

    Rezultatele interogării bazei de date

    Documente simple cu grafică încorporată

    Și, de asemenea, pentru vizualizarea hipertext a matricelor de informații existente

Proiectul World Wide Web (WWW) reunește informații împrăștiate în întreaga lume. Pentru a face acest lucru, WWW utilizează Internet HyperText Transfer Protocol (HTTP) - HyperText Transfer Protocol, care vă permite să introduceți acorduri cu privire la metodele de prezentare a datelor atunci când interacționați între un client și un server.

Datele sunt transmise în corpul mesajului în conformitate cu standardul MIME. HTML este una dintre reprezentările informațiilor de pe WWW. Se presupune că HTML corespunde unuia dintre tipurile MIME, și anume text/html. În plus, HTML este dezvoltat în conformitate cu Standardul Internațional ISO 8879 - Standard Generalized Markup Language (SGML), care este un sistem pentru definirea tipurilor de documente structurate.

document HTML

Un document HTML este similar cu un fișier text, cu excepția faptului că unele caractere (linii) sunt caractere de control. Aceste simboluri se numesc etichete și definesc structura documentului.

Documentele HTML trebuie să înceapă cu eticheta , situat la începutul fișierului și se termină cu eticheta. Între aceste etichete, documentul HTML este organizat ca un document HEAD și BODY, similar unui mesaj de e-mail. În interiorul părții HEAD sunt indicate TITLUL și alte informații despre documentul în ansamblu. În interiorul părții BODY, folosind etichete HTML, textul este structurat în paragrafe, liste etc. cu capacitatea de a evidenția cuvinte individuale și propoziții întregi cu un stil și de a crea link-uri către părți din acesta și documente externe. Din punct de vedere tehnic, etichetele de deschidere și de închidere pentru elementele HTML, HEAD și BODY nu trebuie utilizate. Cu toate acestea, acest lucru nu este recomandat deoarece structura HEAD/BODY permite aplicațiilor să determine caracteristicile documentului (cum ar fi antetul) fără a scana întregul document.

Structura elementelor HTML

Într-un document HTML, etichetele definesc începutul și sfârșitul titlurilor, paragrafelor, listelor, evidențierea caracterelor și legăturile. Majoritatea elementelor HTML dintr-un document sunt definite ca o etichetă de deschidere, care specifică numele și atributele elementului, apoi corpul elementului, urmat de o etichetă de închidere. Caracterele delimitare pentru eticheta de deschidere sunt „<" и ">"; pentru închidere - "". De exemplu:

Acesta este titlul

Acesta este un paragraf.

Unele elemente apar doar ca o etichetă de deschidere. De exemplu, pentru a crea o linie de separare, utilizați eticheta
. În plus, etichetele de închidere pentru unele elemente (P, LI, DT, DD) pot fi omise. Corpul unui element este o secvență de caractere și elemente imbricate. Unele elemente, cum ar fi elementele care definesc legăturile, nu pot fi imbricate. În acest caz, elementele care definesc legăturile și selecțiile de caractere pot fi plasate în interiorul altor structuri.

Afișarea unui document

Afișarea specifică a unui document poate varia de la client la client. Etichetele HTML determină doar stilul general de afișare al documentului. Ceea ce înseamnă, de exemplu, că HTML tratează antetul de primul nivel ca doar un titlu de prim nivel, dar nu specifică că antetul de primul nivel ar trebui să apară cu font Times de 24 de dimensiuni, centrat în partea de sus a paginii. Avantajul acestei abordări este că, dacă utilizatorul decide să schimbe titlul primului nivel la font Helvetica dimensiune 20 aliniat stânga, tot ce trebuie să facă este să schimbe definiția titlului primului nivel în vizualizatorul său WWW. Astfel, prezentarea specifică a documentului pe ecranul monitorului este determinată de utilizatorul unui anumit client.

Principalul punct forte al HTML este capacitatea sa de a lega zone de text (și, de asemenea, imagini) la alte documente. Spectatorii evidențiază aceste zone (de obicei cu culoare și/sau subliniere) pentru a indica faptul că sunt legături hipertext. Ancora este o bucată de text care marchează începutul și/sau sfârșitul unui link hipertext. Textul dintre etichetele de deschidere și de închidere este punctul de plecare sau destinația unui link hipertext. Atributele acestei etichete sunt următoarele: HREF

Opțional. Dacă este prezent atributul HREF, Anchor este text sensibil: punctul de plecare pentru link. Dacă cititorul selectează acest text, i se va prezenta un alt document a cărui adresă de rețea a fost specificată în valoarea atributului HREF. Formatul adresei de rețea este similar cu un URL. Acest lucru permite structurii HREF="#identifier" să se refere la o altă ancoră în documentul curent sau într-un document la distanță specificând adresa sa înainte de semnul „#”.

Opțional. Dacă este prezentă, permite ca ancora să fie utilizată ca destinație de legătură. Valoarea atributului este identificatorul de ancorare Un șir de text obișnuit poate fi utilizat ca valoare de identificare, cu excepția faptului că într-un singur document toți astfel de identificatori trebuie să fie unici.

Opțional. Vă permite să specificați relația dintre documentul de la care a fost făcută legătura și documentul către care a fost făcută legătura.

Toate atributele sunt opționale, cu excepția faptului că, pentru ca eticheta să aibă sens, trebuie să fie prezent fie atributul HREF, fie atributul NAME.

Exemple de utilizare

...

Specifică locația din document către care se va face legătura

...

...