formatul csv si xml

3
Alexandru Adoliu Programator DIP, CST Formatul Comma-Separated Values şi meta-limbajul Extensible Markup Language În prezent în Departamentul informatică de Proces al Teletrans se stochează informaţii atât în fişiere “.csv” cât şi în fişiere “.xml”. Fişierele “.csv” sunt generate de interfaţa web a sistemului “Historical Information System” , de sistemul Energy Management System (care generează fişiere hintorders), de Macro-uri Excel pentru trimitere de date catre server-ul Transelectrica denumit AlphaDen (pentru aplicaţii de monitorizare tensiuni, de reduceri puteri cât şi pentru site). În cadru aplicaţiei de Prognoză a Energiei Eoliene, producători de energie regenerabilă furnizează prognoze intrazilnice şi pentru ziua următoare. Fisiere “.xml” sunt generate în prezent de Sistemul Historical Information System pentru a fi transmise către Piaţa de Echilibrare si de grafiul de curbe de consum de pe server-ul „RNCWEB2”, în viitor se va folisi formatul „.xml” pentru procese asociate Platformei europene de transparenţă. Asemănări dintre cele două formate Amândouă formatele sunt fişiere lizibile de către editoare text indiferent de platformă sistemului de operare (Microsoft-Windows, Apple-iOS sau S.O. Unix/Linux). Ambele formate sunt bine definite pe hard-disk spre deosebire de informaţii aflate in tabele ale bazelor de date, unde alocările fizice a informaţilor sunt manageriate de aplicaţii specializate a bazelor de date. Fişierele acceptă modificări ulteriore. Această caracteristică este importantă în contextul actual dat fiind faptul că aplicaţiile sunt dinamice. Dinamica aplicaţiilor poate să solice ai fi aduse informaţii în plus, mai puţine, sau/şi într-o codificare diferită (encoding). În cadrul fişierelor sunt informaţiile sunt separate în mod lizibil, în cazul „.csv” prin separatorul de rând şi printr-un sepator caracter

Upload: adoliu-alexandru

Post on 07-Sep-2015

24 views

Category:

Documents


1 download

DESCRIPTION

comparatie intre .csv si .xml

TRANSCRIPT

Alexandru AdoliuProgramatorDIP, CSTFormatul Comma-Separated Values i meta-limbajul Extensible Markup Language

n prezent n Departamentul informatic de Proces al Teletrans se stocheaz informaii att n fiiere .csv ct i n fiiere .xml. Fiierele .csv sunt generate de interfaa web a sistemului Historical Information System , de sistemul Energy Management System (care genereaz fiiere hintorders), de Macro-uri Excel pentru trimitere de date catre server-ul Transelectrica denumit AlphaDen (pentru aplicaii de monitorizare tensiuni, de reduceri puteri ct i pentru site). n cadru aplicaiei de Prognoz a Energiei Eoliene, productori de energie regenerabil furnizeaz prognoze intrazilnice i pentru ziua urmtoare. Fisiere .xml sunt generate n prezent de Sistemul Historical Information System pentru a fi transmise ctre Piaa de Echilibrare si de grafiul de curbe de consum de pe server-ul RNCWEB2, n viitor se va folisi formatul .xml pentru procese asociate Platformei europene de transparen.Asemnri dintre cele dou formateAmndou formatele sunt fiiere lizibile de ctre editoare text indiferent de platform sistemului de operare (Microsoft-Windows, Apple-iOS sau S.O. Unix/Linux). Ambele formate sunt bine definite pe hard-disk spre deosebire de informaii aflate in tabele ale bazelor de date, unde alocrile fizice a informailor sunt manageriate de aplicaii specializate a bazelor de date.Fiierele accept modificri ulteriore. Aceast caracteristic este important n contextul actual dat fiind faptul c aplicaiile sunt dinamice. Dinamica aplicaiilor poate s solice ai fi aduse informaii n plus, mai puine, sau/i ntr-o codificare diferit (encoding).n cadrul fiierelor sunt informaiile sunt separate n mod lizibil, n cazul .csv prin separatorul de rnd i printr-un sepator caracter (cel mai uzual este , , de unde si numele formatului, dar pot fi folosite i altele de exemplu caracterul tabulator , spaiul sau semicolon ; ). Pentru .xml informaiile sunt stocate in tag-uri i atribute de tag-uri ( informaie_a_nume_tag )Deosebiri esenialeFormatul .csv poate stoca informaiile folosind mai puin spatiu de pe hard disk dect .xml . De exemplu coloanele din tabelul de mai jos explica cum aceleai informaii sunt Consum orar.csvConsum orar.xml

Moment, Valoare22-07-2014 11:59:26,702622-07-2014 11:49:36,706322-07-2014 11:39:46,696822-07-2014 11:29:56,710122-07-2014 11:20:06,692022-07-2014 11:10:16,698922-07-2014 11:00:26,692522-07-2014 10:50:36,694222-07-2014 10:40:46,699022-07-2014 10:30:56,692222-07-2014 10:21:06,692722-07-2014 10:11:16,689122-07-2014 10:01:26,6900

22-07-2014 11:59:26702622-07-2014 11:49:36706322-07-2014 11:39:46696822-07-2014 11:29:56710122-07-2014 11:20:06692022-07-2014 11:10:16698922-07-2014 11:00:26692522-07-2014 10:50:36694222-07-2014 10:40:46699022-07-2014 10:30:56692222-07-2014 10:21:06692722-07-2014 10:11:16689122-07-2014 10:01:266900

338 bytes1007 bytes

Dei amndou pot fi scrise i editate de editoare text simple, modul de citire pentru programe care folosesc datele este diferit. Din exemplul anterior, ca aflam penultima cea mai ndeprtat valoare (adic informaia 6891) prin formatul .csv trebuie parcus fiierul pn la nregistrarea dorit, dar prin .xml se poate accesa direct .. Acest lucru elibereaz procesorul i memoria cache de procesul de citirea unor informaii inutile i de asemena cresc viteza de procesare. Informaiile din .csv sunt uor integrate n editoare tabelare (Excel) i uor lizibile, pe cnd cele .xml pot fi integrare dar le trebuie aduse completri pentru a le face uor lizibile cu fiiere .xsd (XML Schema Definition) sau .dtd (DOCTYPE declaration) .Asupra fiierelor .xml se poate aplica condiii de validare a datelor. n contextul n care o aplicaie genereaz un .xml care trebuie s conin bine definit unele informaii de tip ntreg (integer) altele de tip ir de caractere (string) , aplicaia care citete datele va avea certitudinea formatrii corecte.Condiiile de legalitate se aplic doar pentru formatul .xml. De exemplu generatorului fiierului .xml din Romania poate descrie prin atribute conveniile regionale de reprezentare a datei sau a formatului real (float) astfel n o aplicaie din orice alt ar poate s interpreteze datele din fiierul genereat n Romania.Formatul .xml accepta relaionri ntre date ce apar n mod recurent prin faptul c .xml are o form ierhizat i auto descriptiv. .csv sau .xmlFolosim .csv cnd control flux-ul de output i input. De exemplu n aplicaia de monitorizare a Energiei Eoliene pentru a citi multiple valori din fiiere multiple (80 fiiere). Fiierele sunt citite complet, iar simplitatea avantajeaz integrarea n aplicaie.Folosim .csv pentru a furniza fiiere excel pentru uurina in care Excel-ul import formatul tabelar.xml este folosit pentru a transfera date ntre platforme diferite realizate de dezvoltatori diferii, de exemplu Historical Information Server i platorma Pieei de Echilibrare.