Communication Foundation – Elosztott programozás Microsoft.NET környezetben

Hernyák Zoltán

Eszterházy Károly Főiskola, Matematikai és Informatikai Intézet

Új Széchenyi Terv logó.

A tananyag a TÁMOP-4.1.2-08/1/A-2009-0046 számú Kelet-magyarországi Informatika Tananyag Tárház projekt keretében készült. A tananyagfejlesztés az Európai Unió támogatásával és az Európai Szociális Alap társfinanszírozásával valósult meg.

A Kelet-magyarországi Informatika Tananyag Tárház logója.

Magyarország megújul logó.

Nemzeti Fejlesztési Ügynökség http://ujszechenyiterv.gov.hu/ 06 40 638-638

Az EU logója.

2011


Tartalom

Előszó
1. Programozási modellek
Szekvenciális programozás
Párhuzamos programozás
Szálak kommunikációja
2. Szálkezelés C# nyelven
Leállás ellenőrzése
Leállás ellenőrzése passzív várakozással
Leállás okának felderítése
Szálindítás példányszint használatával
Komplex probléma
3. A párhuzamos programozás alapproblémái
Komplex probléma
4. Étkező filozófusok
Holtpont
Kiéheztetés
5. Termelő-fogyasztó probléma
Megvalósítás
Megoldás
Befejezési probléma
Leállítás adminisztrálása
A gyűjtő kódjának kiegészítése
Komplex feladat
Szemafórok
Termelő-fogyasztó implementálása szemafórokkal
Összefoglalás
6. A párhuzamos és elosztott működés
Osztályozás
Adatcsatorna
Elágazás
Eldöntés tétele elágazással
Minimumkeresés elágazással
Rendezés párhuzamosan
Asszociatív műveletek
7. Hálózati kommunikáció
Üzenetküldés címzése
IP-cím megállapítása
Beállítások beolvasása
Konfigurációs XML fájl
A teljes portnyitási kód
A kommunikáció megvalósítása
Streamek
Egyszerű kommunikáció a streamen keresztül
Protokoll
A kliens
A kommunikáció
Többszálú szerver
Többszálú szerver problémái
Szerver oldali túlterhelés elleni védekezés
A kliens kommunikációs szálak kezelése
A kliens szálak racionalizálása
Olvasási timeout kezelése
Bináris Stream
Összefoglalás
8. .NET Remoting
A DLL hozzáadása a szerverhez
Az interfész implementálása
A szerver portnyitása
Singleton, Singlecall
Példányszintű mezők
A szolgáltatás összerendelése
Többszálúság
A kliens kódja
Egyedi példányok
A megoldás
Kliens-aktivált példány
Összefoglalás
9. Szerializáció
Bináris szerializáció
Saját típus szerializációja
Serializable
Optional
NonSerialized
Lista manuális szerializációja
Lista automatikus szerializációja
Rekurzív szerializáció
Összefoglalás
10. Web Service
A webszolgáltatások
Első webszolgáltatásunk
SOAP-beküldés
SOAP-válasz
XML-szerializáció
A WSDL és a UDDI
Kliens írása
Sessionkezelés
Összefoglalás
11. Communication Foundation
SOA
Üzenetek forgalmazása
Kérés-válasz
Egyutas
Duplex
Streaming
Pub-sub
Adott sorrendű hívás
A WCF felépítése
„C” – A szerződés
Szerver oldali szerződés
Kliens oldali proxy
ServiceContract részletezése
OperationContract részletezése
Adatszerződés
A DataContract és a DataMember attribútumok
Verziókövetés
Üzenetszerződés
„B” – kötések
BasicHttpBinding
WebHttpBinding
wsHttpBinding
wsDualHttpBinding
wsFederationHttpBinding
netTcpBinding
netNamedPipeBinding
netPeerTcpBinding
netMsmqBinding
msmqIntegrationBinding
Viselkedés
Szolgáltatásszintű viselkedés
„A” – címek
Végpontok
Szerver
Self-hosting
Konfigurációs fájl
Kliens
Loginalapú szerver
Csak sikeres belépés után
A megoldás vázlata
A titkosítás
A szolgáltatás konfigurálása
A bejelentkezés függvénye
Az „olvasatlanDarab” függvény
Az „utolsoUzenetSorszam” függvény
A „letoltes” függvény
A „statuszBeallitas” függvény
Az „uzenetBekuldes” függvény
A „kilepes” függvény
A tesztelés előkészítése
Loginalapú kliens
Sorrendi teszt
Bejelentkezés egy felhasználóval
Bejelentkezés két felhasználóval párhuzamosan
Titkosítás ellenőrzése
Egyéb WCF-tulajdonságok
Zárszó
Irodalomjegyzék

Előszó

Napjaink az egyik legerősebb elvárás a programozási nyelvekkel szemben az egyre olcsóbb többmagos processzorok lehetőségeinek, valamint a hétköznapivá váló nagysebességű hálózati kapcsolatoknak a kihasználása, a programozó támogatása a probléma megoldásában.

A hagyományos programozási modellben a programok egyetlen belépési pontot tartalmaznak, minden utasításra egyértelműen meghatározható a rákövetkező utasítás, egyszerre csak egy utasítás hajtódik végre. Ezt a modellt egyszálú vagy szekvenciális modellnek is nevezzük. A programok tervezése, írása, a nyomkövetés, tesztelés ezen modellben a legegyszerűbb.

A többmagos processzorok számítási teljesítményének kihasználásával a párhuzamos programozás módszerei foglalkoznak. Ezen terület fontos jellemzője, hogy a több magon futó programszálak egymással könnyedén tudnak kommunikálni a közös memória segítségével. A módszer rendkívül egyszerű: a program egyik szála az általa végzett számítás eredményét, részeredményét elhelyezi a memória megfelelő pontján, ahol a másik szál azt meg tudja találni. Persze gondoskodni kell egy speciális jelzésről, melyből ezen másik szál el tudja dönteni, hogy a számítás eredménye elkészült-e már, az adott memóriaterületen található érték a számítás kész eredménye-e, vagy valami korábbi maradvány-érték. További problémákat vethet fel a közösen használt adatterületek konkurens módosítását megakadályozó zárolási mechanizmus, mely rövidzárhoz (deadlock), kiéheztetéshez vezethet.

A fenti problémákkal szembeállítható az elosztott programozás módszere. Ennek során a programunkat fizikailag különböző részekre bontjuk, és ezeket különböző számítógépekre küldjük szét, indítjuk el. A komponensek a hálózati kapcsolaton keresztül felfedezik egymást, majd elkezdik közös munkájukat. Ennek során adatokat cserélnek, részeredményeket képeznek, majd azokat újra összesítik.

Az elosztott programozási modellben a programok nem osztoznak közös memóriaterületeken, így a zárolási problémák nem jelentkeznek. Helyette kommunikációs gondok merülnek fel, melyek összességében hasonló méreteket tudnak ölteni. Ugyanakkor a többmagos rendszerek nehezen bővíthetőek, ill. karbantarthatóak - hiszen a rendszer fizikailag egyetlen számítógépből áll, melynek bármilyen alkatrészének meghibásodása a teljes leálláshoz vezethet. Az elosztott rendszerben több (akár különböző teljesítményű) számítógép vesz részt. Ezek közül bármelyik meghibásodása a javítás időtartamán belül csak az adott egység számítási kapacitását választja le a teljes rendszerről. Az elosztott rendszert általában olcsó bővíteni, karbantartani. Jegyezzük meg azonban, hogy minden esetben az adott környezet, a már jelenlévő infrastruktúra, sok egyéb szempont határozza meg az optimális megoldási módszert.

Könyvünk nagyobb részében ezen elosztott programozási modellel foglalkozik, a kommunikációs megoldást a Microsoft.NET programozási környezetben a 3.0 verzióval hivatalosan is bemutatott Windows Communication Foundation csomaggal oldja meg. Az elméleti problémák ismertetésén túl kliens-szerver alkalmazások tervezésével, készítésével foglalkozunk.

1. fejezet - Programozási modellek

A programozási modellek többek között a különböző teljesítményfokozó lehetőségek kiaknázásáról szólnak. A számítástechnika történetének kezdetén a processzor alacsony számítási kapacitást képviselt. A kapacitás mértéke a FLOPS[1] (floating point operations per second - lebegőpontos műveletek száma másodpercenként), melynek segítségével jellemezhetjük a műveletvégző sebességet.

Az első általános célú teljesen elektronikus számítógép az ENIAC volt, melyet 1946-ban helyeztek üzembe, és a hidrogénbombához szükséges számításokat futtatták rajta. Egy másodperc alatt képes volt 5000 összeadást, 357 szorzást vagy 38 osztást elvégezni.

A Cray Jaguar szuperszámítógép 2009-ben az 1,75 petaFLOPS[2] számítási sebességével az egyik legjelentősebb számítási erőt képviseli. Az IBM 2011-re ígéri a 20 petaFLOPS sebességű Sequoia projektjének befejezését. A jóslatok szerint 2019-re elérjük az 1 exaFLOPS sebességet is. Csak egy apróság – a 2 hetes időjárásjelentés kiszámításához szükséges 1 zettaFLOPS sebességet ez még mindig nem éri el (ennek jósolt időpontja 2030 körülre van becsülve).

A másik lehetséges mérőszáma a processzoroknak az IPS (instructions per second - műveletek száma másodpercenként). Ez persze nem teljesen egyezik a lebegőpontos műveletek számával, de durva nagyságrendi becslésnek megfelel. Az IPS többszöröse a MIPS (millió művelet másodpercenként). Az AMD Athlon FX-57 (debütált 2005-ben) processzor 12 000 MIPS sebességű volt 2,8 GHz órajel mellett. Ezen évtől kezdve a processzorgyártók inkább a többmagos processzorok fejlesztésében gondolkodtak, ez tehát az egyik utolsó ilyen mérőszám, amely még a hagyományos egymagos processzorokat jellemezte.

Egy másik szemléletmódot adott Michael J. Flynn ([flynn]) 1966-ban. Véleménye szerint a számítógép-architektúrákat négy nagy csoportra oszthatjuk:

  • SISD – single instruction, single data stream: a hagyományos számítógép, ahol egyetlen processzor dolgozik egyetlen (általa választott) adathalmazon valamely számításon. A processzor utasítássorozata a program.

  • SIMD – single instruction, multiple data stream: processzorok egy tömbjéről van szó, amelyek mindegyike ugyanazon utasítássorozat ugyanazon fázisában dolgozik, de mindegyik processzor más-más adathalmazon. Ez a feldolgozás egyfajta párhuzamosítását jelenti, ahol a számítást úgy gyorsítjuk fel, hogy a feldolgozandó adatokat részhalmazokra bontjuk, és ezekre külön-külön végezzük el a számításokat.

  • MISD – multiple instruction, single data stream: nem szokásos megoldás, hibatűrő rendszerek tervezésénél használhatjuk. Több (akár különböző felépítésű) processzor ugyanazon az adathalmazon összességében ugyanazon számítást végzi el, a processzorok eközben eltérő fázisban is lehetnek. A számítás eredményét egymással egyeztetve dönthetnek az eredmény hitelességéről.

  • MIMD – multiple instruction, multiple data stream: a klasszikus elosztott rendszer. Különböző processzorok különböző programokat futtatnak különböző adathalmazokon. Mivel nincs kitétel a fizikailag különböző memória szerepére, ezért ezt egyetlen számítógépen belül is megvalósíthatjuk több processzorral vagy több processzormag segítségével.

Szekvenciális programozás

A Neumann-elvek egyike kimondja, hogy a számítógépek műveletvégző rendszere szekvenciális sorrendben kell, hogy feldolgozza a programok utasításait. Az utasításokat a belső memóriában kell tárolni számkódok formájában, csakúgy, mint az adatokat. A processzor egységben egy program counter[3] (PC) egység tartja nyilván, hogy a memória mely pontján található a következő végrehajtandó utasítás. Annak végrehajtása után ezen PC egységben lévő szám módosításával (növelésével) léphetünk a következő utasításra.

Ezen modell szerint a programunk indítása a PC megfelelő beállításával értelmezhető. A programunk legelső végrehajtandó utasításának memóriabeli helyét a PC-be betöltve a processzor el tudja kezdeni az utasítás végrehajtását, a továbbiakban a PC-t megfelelően módosítva önállóan (beavatkozás nélkül) tud működni, a tőle telhető legnagyobb sebességgel végrehajtva a soron következő utasítást, majd lépni a következőre.

Ezt a módszert a mai egymagos processzorok a végletekig optimalizálták. A pipeline technikával, a cache memóriával a következő utasítások végrehajtását próbálják a lehető legjobban előkészíteni, hogy a processzor minél gyorsabban végezhessen azzal. A feltételes elágazásokat egy speciális jósló áramkör elemzi, próbálja megsejteni, melyik ágon folytatódik tovább a program futása. Az órajel végső határokig emelésével és ezen rendkívül fejlett technikákkal az egymagos processzorok teljesítménye hihetetlen magasságokba emelkedett.

De úgy tűnik, ez a határ már nehezen bővíthető. A programozóknak azonban ez a legegyszerűbb, legkevesebb problémát magában foglaló modell, ezért létjogosultsága nem kérdőjelezhető meg. Az algoritmusok és adatszerkezetek tárgy keretein belül megismert módszerek is ezen modellen alapulnak, a hatékonysági jellemzők (legkisebb, átlagos, legnagyobb futási idő, memóriaszükséglet stb.) erre vannak kiszámítva.

Itt értelmezhető először a szál (thread) fogalma, mely azonban itt nem hangsúlyos fogalom. A szál fogalmának megértéséhez képzeljünk el egy vékony zsinórt, melyre gyöngyöket fűzünk fel. A gyöngyök a programunk utasításait szimbolizálják, a szálra fűzés pedig a processzor feldolgozási módszerét jellemzi. A processzor feladata a program futtatása, vagyis az utasítások végrehajtása. A szálra fűzés miatt egy időben csak egy utasítást tud leválasztani, feldolgozni (a következőt), majd ezután tud a következőre lépni. A processzor végez egy program futtatásával, ha a szál utolsó utasítását is végrehajtotta.

Ezen modellhez tartozó algoritmusleírási módszerek közé tartozik a folyamatábra, a struktorgramm, a leíró nyelv. Az imperatív programozási nyelvek mindegyike ezt a modellt támogatja. A C, C++, Pascal, Delphi, Java, C# és egyéb nyelvek alapértelmezett futási modellje a szekvenciális modell.

A modernebb programozási nyelvek támogatást tartalmaznak a többszálú (párhuzamos) modellű programok fejlesztéséhez, és némelyikük az elosztott modellre jellemző kommunikációs problémák kezeléséhez is. De ezek jellemzően technikai támogatások, vagyis függvényeket, eljárásokat (OOP környezetben osztályokat) jelentenek. Ezek mellett a programozóknak nagyon is ismerni kell a modellek működését, a felmerülő problémákat, azok szokásos megoldási módját ugyanúgy, mint ahogy a szekvenciális modellben programozóktól elvárjuk a szekvenciális algoritmusok ismeretét.

Párhuzamos programozás

A párhuzamos programozás során a programunk hagyományos szekvenciális programként indul el, az utasításai felfűzhetők egy szálra, mint a gyöngyök. Egy speciális függvényhívással azonban a programban megjelöl egy másik belépési pontot, majd utasítja a processzort, hogy kezdjen neki ezen szál végrehajtásának is.

Az egymagos processzor természetesen erre fizikailag képtelen. Egy időben csak egy utasítással képes foglalkozni. A két szál párhuzamos futtatását úgy tudja megvalósítani, ha adott pontokon az egyik szál feldolgozását megszakítva átlép a másik szál feldolgozására, majd újra vissza az elsőre. Az adott pontok meghatározása külön probléma, de a prioritások segítségével ez egyszerűen megérthető: a szálakhoz prioritásokat rendelhetünk, melyek azok fontosságát jelölik. A magasabb prioritású szál futását fontosabbnak jelöljük, így a vezérlés erre a szálra gyakrabban kerül[4]. Az egyiknek tehát több időszelet jut, mint a másiknak. Az idő lejártával a processzor befagyasztja az aktuális szál végrehajtását, majd áttér a másikra. Az 1.1. ábra bemutatja, hogyan értelmezhető ez az adott szál szemszögéből.

1.1. ábra. Szálváltások

Jelen ponton már fontos tisztázni két fogalom pontos jelentését. A processz vagy folyamat egy olyan környezetet takar, amely egy program indítása során keletkezik, és a program futásának időtartama alatt végig létezik, annak teljes életciklusát végigkísérve. Egy ilyen processz nemcsak a futó kódot tartalmazza, hanem annak leírását is, hogy a kódot milyen felhasználó nevében, milyen jogosultsággal indítottuk el. Az operációs rendszer a program indulásakor memóriát is foglal nemcsak a kódnak, de az adatoknak is, amelyeket szintén a processzhez rendel hozzá. Ennek következtében az allokált memória akkor törlődhet csak, amikor maga a processz befejeződik, vagyis a teljes program leáll.

A szál (thread) a processz egyik építőeleme. A szál a kód egy szeletének utasítássorozata (1.2. ábra), amelynek állapota lehet futó (running), leállt (finished) vagy várakozó (standby). Egyéb adminisztratív, rövid ideig jellemző állapotok is léteznek (pl. futáskész [ready]), de ezek most számunkra nem annyira érdekesek.

1.2. ábra. Processz

Az alkalmazás indításakor az operációs rendszer létrehozza a processzt, majd betölti a kódot, létrehoz egy szálat, a szál kezdőpontját a Main függvény kezdőpontjára állítja[5], és a szálat indítja (running state).

A futó szál újabb szálakat hozhat létre, megjelölve az adott szálhoz tartozó kód indulási pontját. Ez legegyszerűbben úgy kivitelezhető, ha a szál létrehozásakor megnevezzük egy függvényünket, melynek belépési pontja lesz a szál kezdőpontja (ez gyakorlatilag megegyezik az operációs rendszer módszerével, ami a Main függvényünk belépési pontját veszi kiindulási pontnak).

Egy szál futása befejeződik, ha a szálhoz rendelt utasítássorozat véget ér, vagyis ha a szálhoz rendelt függvény befejezi a futását. Ez bekövetkezhet oly módon is, hogy a függvényben egy kivétel (exception) váltódik ki. A kezeletlen kivétel terminálja az adott szálat, de más szálakra a hatása nem terjed át[6]. Ez azt jelenti, hogy nem kell aggódnunk amiatt, hogy egy elindított szálban keletkező kivétel az indító szál leállítását is okozhatja. Másrészt azt is jelenti, hogy nem nagyon van módunk ahhoz az információhoz hozzájutni, hogy az általunk indított szálban kivétel keletkezett-e vagy sem.

Szálak kommunikációja

A szálak a processz belsejébe zárt építőelemek, így hozzáférnek a processz egy másik építőeleméhez: a processzhez tartozó, adatokat tároló memóriaterülethez. Ezen a memóriaterületen osztoznak egymással. Ez egyúttal a párhuzamos programozás előnye és hátránya is egyben.

A szálak között mindig szükséges némi kommunikáció, adatcsere. Ezt pontosan a közös memóriaterület segítségével lehet áthidalni – az egyik szál elhelyezi a küldeni kívánt adatokat egy előre megbeszélt memóriaterületre (változó), majd a másik szál egyszerűen kiolvassa onnan azt. A válaszát is hasonlóan tudja visszaküldeni – ő is elhelyezi egy közös változóban, majd az első szál onnan ki tudja azt olvasni (1.3. ábra).

1.3. ábra. A szálak a közös memórián osztoznak

Ez a módszer egyúttal két dolgot is jelent. Az egyik olvasata ezeknek a tényeknek az, hogy az indítás során a függvénynek paramétert nem feltétlenül egyszerű átadni, helyette szokásos az átadandó értékeket az indítás előtt elhelyezni a közös változókban. A másik olvasata szerint a függvény nem rendelkezik visszatérési értékkel (return), helyette a visszaadandó értéket szintén egy közös változóba helyezi el, majd leáll.

Természetesen a való életben ez egy kicsit bonyolultabb. Mindenképpen szükség van egyfajta mechanizmusra, amelynek segítségével a szálak el tudják dönteni, hogy az adott változóba a keresett érték elhelyezésre került-e már, vagy sem. Ez nem a függvény indulásakor kérdéses elsősorban, hiszen az értékeket már indítás előtt el kell helyezni. Sokkal fontosabb annak vizsgálata során, hogy a függvény által generált válaszérték már bekerült-e a változóba, vagy sem. Erre a szóban forgó változó egyedül ritkán alkalmas, mivel a változókban minden időpillanatban található valamilyen érték, így nehéz megkülönböztetni egymástól azt a szituációt, amikor a változóban valamilyen korábbi érték van még mindig, vagy már az új, generált érték.

Utóbbit technikailag megoldhatnánk annak vizsgálatával, hogy az adott szál milyen státuszban van. Ha még mindig futó státuszú, akkor a visszatérési értéket még nem állította elő. Ha befejezett státuszú, akkor már beírta a visszatérési értékét. Ne felejtsük el azonban, hogy egy szál akkor is kerülhet befejezett állapotba, ha a szál leállását egy kezeletlen kivétel váltotta ki (mely esetben a visszatérési érték nem került be a szóban forgó változóba)! Ezért ez a módszer önmagában ritkán használható.



[1] néha flop/s-nak írják, gyakran azt hiszik, hogy a szó végi s a többes szám jele, így a flop kifejezés is bekerült a köztudatba (hibásan)

[2] peta = , exa = , zetta =

[3] egyes irodalmak instruction pointer-nek is nevezik

[4] vagy a processzor több utasítást dolgoz fel a váltás előtt, mint egy alacsonyabb prioritású szálról

[5] valójában a kezdőpont ennél korábbi pont, a Main indulása előtt még egy előkészítő, inicializáló kód is le szokott futni, de jelen esetben annak szerepe érdektelen

[6] a .NET környezetben ez a Thread osztályra jellemző viselkedés, a .NET v4-ben bevezetett Task osztály esetén már ez nem feltétlenül igaz

2. fejezet - Szálkezelés C# nyelven

A C# nyelven az előző fejezetekben foglaltak szerint a szálindítást egy olyan függvényen kell elvégezni, amely nem fogad bemenő paramétereket, és nem készít visszatérési értéket. Helyette a kommunikációt változókon keresztül valósítjuk meg.[7]

Az alábbi kis program egy osszeadas() nevű függvényt fog külön szálon futtatni, mely két egész szám összegét számolja ki. A főprogram a paramétereket elhelyezi két osztályszintű mezőben, létrehozza és indítja a szálat, majd jelképesen valamely egyéb tevékenységbe fog, amíg a szál befejezi a munkáját. A kapott eredményt kiírja a képernyőre.

2.1. forráskód. Az első változat

     
using System; 
using System.Threading; 
class Program 
{ 
   static void Main() 
   { 
      // elokeszitjuk a parametereket 
      bemeno_a = 10; 
      bemeno_b = 20; 
      // letrehozzuk es inditjuk a szalat 
      Thread t = new Thread(osszeadas); 
      t.Start(); 
      // 
      // csinalunk valami hasznosat 
      // amig a masik szal szamol 
      // 
      // kiirjuk az eredmenyt 
      Console.WriteLine(kimeno_c); 
      // <enter> leutesere varakozas 
      Console.ReadLine(); 
   } 
   // 
   static int bemeno_a; 
   static int bemeno_b; 
   static int kimeno_c; 
   // 
   static void osszeadas() 
   { 
      // a szamitasi folyamat kulon szalon 
      kimeno_c = bemeno_a + bemeno_b; 
   } 
}
    

A 2.1. videón szereplő teszt program annyiban változik, hogy a Main lényegét alkotó kódot egy ciklusba ágyazva többször is elindítjuk. A fő szálba több ponton kiírásokat helyeztünk el, melyeket minden esetben sárga színnel írunk ki. A második szál (osszeadas függvény) kódjába is elhelyeztünk kiírásokat, de ezek zöld színnel jelennek meg.

A szálváltások általában úgy következnek be, hogy a főszálnak még van ideje kiírni az eredményt, mielőtt az elindított második szálból egyáltalán bármilyen utasítás sorra kerülhetne. A 9. teszt esetén már a második szál elindulása bekövetkezik, mielőtt visszaváltana a fő szálra a kiíráshoz, de a második szálnak még nem volt ideje kiszámítani az eredményt. Viszont a színváltások is összezavarodnak, a fő szál sárga kiírása zölden jelenik meg, mivel a szálváltások úgy követték egymást, hogy

  • fő szál: sárga írási szín kiválasztása,

  • második szál: zöld színre váltás,

  • fő szál: „eredmény kiírása” szöveg megjelenetítése

  • második szál: „indul” szöveg megjelenítése

  • fő szál: a még ki nem számított eredmeny_c értékének (ekkor az még nulla) kiírása

  • második szálra váltás.

Az 55. teszt futás is érdekes eredményt hoz, ott a második szál már ki tudta számolni az eredményt, de mielőtt kiírhatta volna az „elkészült” szöveget, visszaváltott a fő szálra, aki épp ekkor látott neki a kiírásnak. Ezért ezen lefutás sikeresnek tekinthető (a színek itt is összezavarodtak a színváltások és a kiírások közötti váltásoknak köszönhetően).

Leállás ellenőrzése

A 2.1 kódban érezhető, hogy a megoldás rizikós. A 19. sorban szereplő kiíró utasítás nem lehet biztos benne, hogy a másik szál elkészült már a számítás eredményével. Az ellenőrzés hiányában a kiírás természetesen működni fog, hiszen a kimeno_c mezőben lesz valamilyen érték, ám egyáltalán nem biztos, hogy a helyes, számított értéket fogjuk megtalálni benne.

A szál befejezettségének ellenőrzéséhez bevezethetünk egy újabb, logikai változót. Ezen változó false értéke jelentse a szál nem befejezett állapotát, true értéke pedig a hibátlan lefutás és befejezettség állapotát!

2.2. forráskód. Szál befejezettségének ellenőrzése logikai változóval

     
using System; 
using System.Threading; 
class Program 
{ 
   static void Main() 
   { 
      // elokeszitjuk a parametereket 
      bemeno_a = 10; 
      bemeno_b = 20; 
      szal_kesz = false; 
      // letrehozzuk es inditjuk a szalat 
      Thread t = new Thread(osszeadas); 
      t.Start(); 
      // 
      // csinalunk valami hasznosat 
      // amig a masik szal szamol 
      // 
      // varunk a szal kesz allapotra 
      while (!szal_kesz) ; 
      // majd kiirjuk az eredmenyt 
      Console.WriteLine(kimeno_c); 
      // <enter> leutesere varakozas 
      Console.ReadLine(); 
   } 
   // 
   static int bemeno_a; 
   static int bemeno_b; 
   static int kimeno_c; 
   static volatile bool szal_kesz; 
   // 
   static void osszeadas() 
   { 
      // a szamitasi folyamat kulon szalon 
      kimeno_c = bemeno_a + bemeno_b; 
      // szal kesz allapotba lepunk 
      szal_kesz = true; 
   } 
}
    

Ebben az esetben a 2.2. forráskód 10. sorában beállítjuk a szál még nincs kész állapotot, majd a 20. sorban megvárjuk, míg a szál kész állapot bekövetkezik. A szál ezen állapotába csak az osszead() függvény legvégén lép át, így addigra a kimeno_c változóba már a helyes, számított érték kerül.

A forráskódban szerepel egy speciális módosító: a volatile. Ezt a módosítót csak mezőre alkalmazhatjuk, metódusokban szereplő (lokális) változókra nem. A volatile módosító arra hívja fel a fordító (ezen belül elsősorban a kódgeneráló, kódoptimalizáló rész) figyelmét, hogy ezen mezőre időben egymással párhuzamosan futó szálak hivatkoznak. Ennek eredményeképp a a generált kód a változóra hivatkozás során az akutális értéket minden esetben a memóriából fogja kiolvasni, még akkor is, ha egy előző lépés során ezt már megtette, és az értéket el is tárolta ideiglenesen a processzor valamely belső regiszterében. E miatt a szál minden esetben a változó legfrissebb értékét fogja használni, mely a memóriából az adott pillanatban kerül kiolvasásra, s nem valami cache-szerű helyen tárolt régebbi értéket. Hasonlóan: a változóba íráskor az új érték azonnal ki is íródik a memóriába, nem kerülhet késleltetésre a generált kódban valamiféle optimalizálási ok miatt.

Legendás kulcsszó ez, egyes C, C++ fordítók futási sebesség optimalizálási lépései során a generált kód és a forráskód már csak nagyon távoli hasonlóságot mutatnak. Egyes esetekben előfordulhat, hogy a forráskód valamely osztályában deklarált mező a generált kódban már nincs is jelen. Ha a fordító ugyanis úgy érzi, hogy a mezőre igazából csak egyetlen metódus hivatkozik, akkor a mezőt lokális változóként kezelheti. Amennyiben a metódus is csak egy rövid kódrészletben használja a mezőt fel, elképzelhető az is, hogy változót sem hoz létre a kódgeneráló, hanem ezen időszakra a processzor valamely regiszterében tárolja végig a mező aktuális értékét. Egy ilyen végletekig optimalizált metódust több szálon elindítva az egyes metódusok képtelenek lesznek egymással kommunikálni ezen mezőn keresztül. Pusztán a forráskódot olvasva a kód jónak tűnhet, a futó program mégis az elvártaktól eltérően viselkedhet. El tudjuk képzelni mennyi munkaóra hibakeresés és mekkora élmény mire a kódot „jól” megíró programozó rádöbben a hiba valódi okára. A rádöbbenésen túl persze még mindig fennmarad a kérdés: és hogy vegyem rá a kódoptimalizálót hogy ezt ne tegye velem? A válasz adott: a volatile kulcsszó!

A 2.2. videón látható programot hasonlóan az előzőekhez, bővítettük színezett kiírásokkal. A főprogram zöld, a második szál sárgával ír. A 20. sorban szereplő while ciklusmagjába # jelek kiírását helyeztük el, hogy látható váljon a ciklusmag többszöri lefutása. A videón látható teszt futási eseteken megfigyelhető, hogy a while ciklusmag hol több, hol kevesebb # jelet tud kiírni, míg a második szál befejezi a számítást attól függően, hogyan következnek be a szálváltások.

A megoldás egyszerűnek tűnik, de súlyos elvi hibákat tartalmaz. Vegyük őket sorra!

Az első probléma maga a plusz egy logikai változó használata. Amennyiben több szálunk is lenne, a logikai változók elszaporodnának a programban, szükségtelen és nehezen kezelhető hibalehetőségekkel telítve az amúgy sem könnyen olvasható és átlátható programunkat.

A következő probléma maga a várakozás megvalósítása. A 20. sorban feltüntetett while ciklus várakozásában nincs időtúllépés, timeout kezelési lehetőségünk, ha a másik szál valamilyen kivétel folytán nem fejezi be a működését, és nem billenti be a szál kész állapotba a logikai változónkat, úgy a várakozás örökké tarthat.

Nagyon súlyos probléma azonban az aktív várakozási mód. A fő szál a várakozása közben egy ciklust futtat. Ennek során másodpercenként több milliószor ellenőrzi, hogy befejeződött-e már a számolás. Ezt az aktív várakozást busy waiting-nek nevezzük. Ha visszaemlékezünk a korábbiakra, az operációs rendszer a működő szálak között a prioritásuknak megfelelően szálváltásokat végez. A fő szál a ciklust futtatja, így sok processzoridőt köt le, a másik szál eközben nem tud haladni a saját feladatával, a számolás minél korábban történő befejezésével. A busy waiting módszer kerülendő!

Leállás ellenőrzése passzív várakozással

A megoldást az eseményre történő passzív várakozás jelenti. A fenti kódban szereplő t változó nemcsak arra használható, hogy segítségével a szálat indítani lehessen (t.Start()), hanem segítségével a már elindított szál állapota is lekérdezhető, és további műveletek is elérhetőek. A számunkra most fontos műveletet Join()-nak nevezzük, mely csatlakozás-t jelent. Jelen környezetben egyszerűbb ezt passzív várakozás a szál leállására műveletnek értelmezni.

2.3. forráskód. A Join() használata

     
using System; 
using System.Threading; 
class Program 
{ 
   static void Main() 
   { 
      // elokeszitjuk a parametereket 
      bemeno_a = 10; 
      bemeno_b = 20; 
      // letrehozzuk es inditjuk a szalat 
      Thread t = new Thread(osszeadas); 
      t.Start(); 
      // 
      // csinalunk valami hasznosat 
      // amig a masik szal szamol 
      // 
      // varunk a szal leallasara 
      t.Join(); 
      // majd kiirjuk az eredmenyt 
      Console.WriteLine(kimeno_c); 
      // <enter> leutesere varakozas 
      Console.ReadLine(); 
   } 
   // 
   static int bemeno_a; 
   static int bemeno_b; 
   static int kimeno_c; 
   // 
   static void osszeadas() 
   { 
      // a szamitasi folyamat kulon szalon 
      kimeno_c = bemeno_a + bemeno_b; 
   } 
}
    

2.3. videó. A Join() alkalmazása

A 2.3. videón látható, hogy a Join alkalmazásával a működés garantáltan helyes, mivel a fő szál az eredményt stabilan helyesen írja ki, eközben nincsenek felesleges műveletek, sem felesleges extra változók alkalmazva.

A t.Join() végrehajtása során a fő szál működését az operációs rendszer felfüggeszti (sleep), amíg az érintett másik szál (t) le nem áll. Amikor ez bekövetkezik, a fő szál felébred (resume), fut tovább, és esetünkben kiírja a képernyőre a számítás eredményét. Amennyiben a t.Join() kezdetekor az érintett szál már eleve leállt állapotú, úgy a fő szál várakozásmentesen lép a kiíró utasításra.

A Join() művelettel passzív módon tudunk várakozni egy másik szál befejezésére, ezzel el tudjuk kerülni a busy waiting megoldást. Ezzel a módszerrel sem tudjuk megkülönböztetni azonban a leállás okát, mely történhet a normál működés végén, de lehet kezeletlen kivétel miatti leállás is.

Leállás okának felderítése

Az előző két módszert ötvözve kideríthetjük a leállás okát. Pontosabban kideríthetjük, hogy a szál hibátlanul lefutott-e. Ehhez a szálindítás előtt a logikai változót ugyanúgy állítsuk false értékre, majd a t.Join() segítségével várakozzunk a szál leállására! Legyen a szálhoz tartozó függvény utolsó lépése most is a logikai változó true értékre állítása! A t.Join() után a fő szál ellenőrizni tudja, hogy a logikai változóba bekerült-e a true érték vagy sem. A jobb szervezés miatt a külön szálon futó függvényt és a szükséges mezőket ebben a példában külön osztályba helyeztük ki.

2.4. forráskód. A szálfunkciók kihelyezése külön osztályba

     
using System; 
using System.Threading; 
class Program 
{ 
   static void Main() 
   { 
      // elokeszitjuk a parametereket 
      Osszeadas.bemeno_a = 10; 
      Osszeadas.bemeno_b = 20; 
      Osszeadas.szal_kesz = false; 
      Osszeadas.kivetel = null; 
      // letrehozzuk es inditjuk a szalat 
      Thread t = new Thread(Osszeadas.osszeadas); 
      t.Start(); 
      // 
      // csinalunk valami hasznosat 
      // amig a masik szal szamol 
      // 
      // varunk a szal kesz allapotra 
      t.Join(); 
      // majd kiirjuk az eredmenyt 
      if (Osszeadas.szal_kesz) 
      { 
       Console.WriteLine(Osszeadas.kimeno_c); 
      } 
      else 
      { 
       Console.Write("A␣szal␣kivetel␣miatt␣allt␣le"); 
       Console.WriteLine(Osszeadas.kivetel.Message); 
      } 
      // <enter> leutesere varakozas 
      Console.ReadLine(); 
   } 
}
    

A kivétel utólagos elemzése és feldolgozása céljából egy plusz mezőt vezetünk be, melyet a főprogram null értékre állít indulás előtt. Ebben a mezőben tudjuk kimenekíteni, elhelyezni az esetlegesen keletkezett kivételünk leírását a try ... catch alkalmazásával.

2.5. forráskód. Kivétel kimenekítése

 
class Osszeadas 
{ 
   public static int bemeno_a; 
   public static int bemeno_b; 
   public static int kimeno_c; 
   public static volatile bool szal_kesz; 
   public static Exception kivetel; 
   // 
   public static void osszeadas() 
   { 
      try 
      { 
         // a szamitasi folyamat kulon szalon 
         kimeno_c = bemeno_a + bemeno_b; 
         // szal kesz allapotba lepunk 
         szal_kesz = true; 
      } 
      catch (Exception e) 
      { 
         // kimenekitjuk a kivetel leirot 
         kivetel = e; 
      } 
   } 
}

Szálindítás példányszint használatával

Szálat nemcsak osztály-, hanem példányszintű metódusra alapozva is el lehet indítani. Mindössze arra kell ügyelni, hogy példányra is szükségünk lesz. Ugyanakkor ki tudjuk aknázni annak előnyét, hogy a példánynak saját, a többi példánytól független mezői vannak, így ha az adott függvényből több szálat is szeretnénk indítani, akkor könnyebb az adatokat elkülönítetten kezelni.

2.6. forráskód. Példányszintű metódus indítása

                                                                                                                                     

                                                                                                                                     
     
class Osszeadas 
{ 
   public int bemeno_a; 
   public int bemeno_b; 
   public int kimeno_c; 
   public volatile bool szal_kesz; 
   public Exception kivetel; 
   // 
   public void osszeadas() 
   { 
      try 
      { 
         // a szamitasi folyamat kulon szalon 
         kimeno_c = bemeno_a + bemeno_b; 
         // szal kesz allapotba lepunk 
         szal_kesz = true; 
      } 
      catch (Exception e) 
      { 
         // kimenekitjuk a kivetel leirot 
         kivetel = e; 
      } 
   } 
}
    

2.7. forráskód. Példányszintű metódus indítása

 
using System; 
using System.Threading; 
class Program 
{ 
   static void Main() 
   { 
      // elokeszitjuk a parametereket 
      Osszeadas p = new Osszeadas(); 
      p.bemeno_a = 10; 
      p.bemeno_b = 20; 
      p.szal_kesz = false; 
      p.kivetel = null; 
      // letrehozzuk es inditjuk a szalat 
      Thread t = new Thread(p.osszeadas); 
      t.Start(); 
      // 
      // csinalunk valami hasznosat 
      // amig a masik szal szamol 
      // 
      // varunk a szal kesz allapotra 
      t.Join(); 
      // majd kiirjuk az eredmenyt 
      if (p.szal_kesz) 
      { 
       Console.WriteLine(p.kimeno_c); 
      } 
      else 
      { 
       Console.Write("A␣szal␣kivetel␣miatt␣allt␣le"); 
       Console.WriteLine(p.kivetel.Message); 
      } 
      // <enter> leutesere varakozas 
      Console.ReadLine(); 
   } 
}

A konstruktorok és a mezők kezdőértékadásának segítségével ez a művelet egészen le tud egyszerűsödni (lásd a 2.8. és a 2.9. forráskódokat).

2.8. forráskód. Konstruktor használata

 
using System; 
using System.Threading; 
class Program 
{ 
   static void Main() 
   { 
      Osszeadas p = new Osszeadas(10,20); 
      Thread t = new Thread(p.osszeadas); 
      t.Start(); 
      // 
      t.Join(); 
      // majd kiirjuk az eredmenyt 
      if (p.szal_kesz) 
      { 
       Console.WriteLine(p.kimeno_c); 
      } 
      else 
      { 
       Console.Write("A␣szal␣kivetel␣miatt␣allt␣le"); 
       Console.WriteLine(p.kivetel.Message); 
      } 
      // <enter> leutesere varakozas 
      Console.ReadLine(); 
   } 
}

2.9. forráskód. Az objektum forráskódja

 
class Osszeadas 
{ 
   public int bemeno_a; 
   public int bemeno_b; 
   public int kimeno_c; 
   public volatile bool szal_kesz = false; 
   public Exception kivetel = null; 
   // 
   public Osszeadas(int a,int b) 
   { 
    bemeno_a=a; 
    bemeno_b=b; 
   } 
   // 
   public void osszeadas() 
   { 
      try 
      { 
         // a szamitasi folyamat kulon szalon 
         kimeno_c = bemeno_a + bemeno_b; 
         // szal kesz allapotba lepunk 
         szal_kesz = true; 
      } 
      catch (Exception e) 
      { 
         // kimenekitjuk a kivetel leirot 
         kivetel = e; 
      } 
   } 
}

A szálkezelést természetesen kihelyezhetjük az adott osztályba is, még áttekinthetőbb és OOP elveknek[8] megfelelőbb megoldást adva ezzel. A 2.10. forráskódban a Main metódusban már nincs explicit szálkezelés, mindent a példány metódusai végeznek. E miatt a Main megírására olyan programozó is vállalkozhat, aki a szálkezeléssel kapcsolatosan nem rendelkezik kellő rutinnal.

2.10. forráskód. OOP elveknek megfelelőbb Main

                                                                                                                                     

                                                                                                                                     
     
using System; 
using System.Threading; 
class Program 
{ 
   static void Main() 
   { 
      Osszeadas p = new Osszeadas(10,20); 
      p.indit(); 
      p.bevarMigKesz(); 
      // majd kiirjuk az eredmenyt 
      if (p.szal_kesz) 
      { 
       Console.WriteLine(p.kimeno_c); 
      } 
      else 
      { 
       Console.Write("A␣szal␣kivetel␣miatt␣allt␣le"); 
       Console.WriteLine(p.kivetel.Message); 
      } 
      // <enter> leutesere varakozas 
      Console.ReadLine(); 
   } 
}
    

2.11. forráskód. Az objektum forráskódja

 
class Osszeadas 
{ 
   public int bemeno_a; 
   public int bemeno_b; 
   public int kimeno_c; 
   public volatile bool szal_kesz = false; 
   public Exception kivetel = null; 
   protected Thread t = null; 
   // 
   public Osszeadas(int a,int b) 
   { 
    bemeno_a=a; 
    bemeno_b=b; 
   } 
   // 
   public void indit() 
   { 
      this.t = new Thread(p.osszeadas); 
      t.Start(); 
   } 
   // 
   public bool bevarMigKesz() 
   { 
      t.Join(); 
      return szal_kesz; 
   } 
   // 
   public void osszeadas() 
   { 
      try 
      { 
         // a szamitasi folyamat kulon szalon 
         kimeno_c = bemeno_a + bemeno_b; 
         // szal kesz allapotba lepunk 
         szal_kesz = true; 
      } 
      catch (Exception e) 
      { 
         // kimenekitjuk a kivetel leirot 
         kivetel = e; 
      } 
   } 
}

Megjegyzés: a bevarMigKesz() metódus bool típusú, és eleve a saját szal_kesz értékével tér vissza. Rutinosabb programozók ezen tudnának spórolni egy sort a Main megírása közben (a 2.10 forráskódhoz képest. Ezen megoldás részletét a 2.12. forráskód mutatja be.

2.12. forráskód. Rövidebb Main

 
   static void Main() 
   { 
      Osszeadas p = new Osszeadas(10,20); 
      p.indit(); 
      if (p.bevarMigKesz()) 
      { 
       Console.WriteLine(p.kimeno_c); 
      } 
      else 
      { 
       Console.Write("A␣szal␣kivetel␣miatt␣allt␣le"); 
       Console.WriteLine(p.kivetel.Message); 
      }

Ugyanakkor az if (p.bevarMigKesz()) feltételvizsgálat értelmet zavaró megfogalmazású. Hogy értjük ezt? Az else ág akkor fog lefutni, ha nem vártuk be míg kész? Egy jobb névadás, pl. if (p.hibatlanKesz()) esetén is fennmaradhatnak ilyen kérdések az else felé, pl. most akkor azért else ág, mert nem lett hibátlan, vagy mert nem lett kész? Ilyen és ehhez hasonló kérdésekkel foglalkozó programozókat az „ifjú titánok” meg szokták mosolyogni, míg ők is el nem jutnak a bölcsesség azon fokára (és kellő mennyiségű szabadidővel rendelkeznek), ahol ezek a kérdések már fontossá válnak. Visszatérve: ehhez hasonló problémák elkerülése miatt a 2.10. forráskód megfogalmazását így kissé bőbeszédűbbre, de talán jobban érthetőbbre választottuk.

Komplex probléma

Teszteljük az eddig megszerzett ismereteinket egy egyszerű többszálú alkalmazás fejlesztésével! A feladat: indítsunk el két szálat, az egyik sárgával, a másik zöld színnel írjon a képernyőre! Mindkettő 110 közötti számokat írjon ki! Minden számkiírás után véletlen ideig várakoznak – ezredmásodpercig! Így van esély, hogy az egyik szál leelőzze a másikat. A program a két szál leállása után írja ki a Mindkét szál kész! üzenetet (a program egy lehetséges futási eredményéről készült képernyőt lásd a 2.1. ábrán)! A feladat megoldása a 2.13. forráskódban olvasható, a kimeneti képernyő, a program kiírásai a 2.4. videón tekinthető meg.

2.1. ábra. A feladat elvárt kimeneti képernyője

2.4. videó. A program futása

2.13. forráskód. A komplex feladat megoldása

     
using System; 
using System.Threading; 
 
class Program 
{ 
   static Random rnd = new Random(); 
   static void Main(string[] args) 
   { 
      Thread t1 = new Thread(Kiir_1); 
      t1.Start(); 
      Thread t2 = new Thread(Kiir_2); 
      t2.Start(); 
      t1.Join(); 
      t2.Join(); 
      Console.ForegroundColor = ConsoleColor.Gray; 
      Console.WriteLine("Mindket␣szal␣kesz!"); 
      Console.ReadLine(); 
   } 
 
   static void Kiir_1() 
   { 
      for (int i = 0; i < 10; i++) 
      { 
         Console.ForegroundColor = ConsoleColor.Yellow; 
         Console.WriteLine("1-es␣szal␣{0}",i+1); 
         Thread.Sleep(rnd.Next(500, 1200)); 
      } 
   } 
   static void Kiir_2() 
   { 
      for (int i = 0; i < 10; i++) 
      { 
         Console.ForegroundColor = ConsoleColor.Green; 
         Console.WriteLine("2-es␣szal␣{0}", i + 1); 
         Thread.Sleep( rnd.Next(500,1200)); 
      } 
   } 
}
    


[7] valójában van lehetőség arra, hogy az adott függvény fogadjon egyetlenegy object típusú paramétert is

[8] elsősorban az egységbezárás (encapsulation) elvének

3. fejezet - A párhuzamos programozás alapproblémái

A párhuzamos programozás erőssége és gyengéje éppen a közös memóriaterület használata. Ehhez az alábbi dolgokat kell felismernünk:

  • A magas szintű programozási nyelv utasításai nem számítanak elemi szintűeknek a processzor gépi kódjának szintjén.

  • A szálváltások két (elemi) gépi kódú utasítás között következnek be.

  • A szálváltások kiszámíthatatlan (nem determinisztikus) pillanatokban következhetnek be.

Vegyük a következő példát! A programban szerepel egy 1000000 elemű vektor, melyhez ki kell számítani az elemeinek összegét. A program két szálat indít – az egyik szálon számoljuk ki a 0...499999 közötti elemek összegét, a második szál összegzi az 500000...1000000 közötti sorszámú elemek összegét. A két szál mindegyike a közös osszeg változóba akkumulálja az összeget (lásd a 3.1. forráskód, a program futási tesztjei a 3.1. videón látható).

3.1. forráskód. Vektorelemek összege

     
using System; 
using System.Threading; 
 
class Program 
{ 
   static int[] tomb = new int[1000000]; 
   static int osszeg = 0; 
   static void Main(string[] args) 
   { 
      Random rnd = new Random(); 
      for (int i = 0; i < tomb.Length; i++) 
         tomb[i] = rnd.Next(100, 200); 
      Thread t1 = new Thread(osszeg_1); 
      t1.Start(); 
      Thread t2 = new Thread(osszeg_2); 
      t2.Start(); 
      t1.Join(); 
      t2.Join(); 
      Console.WriteLine("Osszeg␣2␣szalon={0}",osszeg); 
      int norm = 0; 
      foreach(int x in tomb) 
         norm = norm+x; 
      Console.WriteLine("Osszege␣normal={0}", norm); 
      if (norm != osszeg) Console.WriteLine("!!!␣HIBA␣!!!"); 
      Console.ReadLine(); 
   } 
   static void osszeg_1() 
   { 
      for (int i = 0; i < tomb.Length/2; i++) 
         osszeg = osszeg + tomb[i]; 
   } 
   static void osszeg_2() 
   { 
      for (int i = tomb.Length / 2; i < tomb.Length; i++) 
         osszeg = osszeg + tomb[i]; 
   } 
}
    

3.1. videó. A program futása

Az osszeg = osszeg + t[i] kifejezést kell alaposabban szemügyre vennünk. Ez elemi szintű utasítás a C# nyelven, de gépi kód szintjén (legkevesebb) az alábbi lépésekből áll (lásd a 3.1. ábrát):

  • osszeg változó aktuális értékének beolvasása

  • t vektor i. értékének beolvasása a memóriából

  • a két érték összegének kiszámítása

  • az új érték visszaírása a memóriába, az osszeg változó területére

3.1. ábra. A végrehajtás lépései

Amennyiben a szálváltás a következő mintát követi, úgy a végrehajtás hibás működésű lesz. A könnyebb érthetőség kedvéért vigyük végig a példát – osszeg = 10, az 1. szálon a következő t[i] érték legyen 12, a 2. szálon pedig a következő t[i] érték legyen 24! Azt várjuk, hogy az összeg értéke a végére 10 + 12 + 24, vagyis 46 legyen (lásd a 3.2. kép).

3.2. ábra. Problémás szálváltás

  • 1. szál: összeg aktuális értékének beolvasása a memóriából (10)

  • 1. szál: t[i] aktuális értékének beolvasása a memóriából (pl. 12)

  • szálváltás

  • 2. szál: összeg aktuális értékének beolvasása a memóriából (10)

  • 2. szál: t[i] aktuális értékének beolvasása a memóriából (pl. 24)

  • 2. szál: összeadás elvégzése (34)

  • 2. szál: érték visszaírása a memóriába (összeg = 34)

  • szálváltás

  • 1. szál: összeadás elvégzése (22)

  • 2. szál: érték visszaírása a memóriába (összeg = 22)

Mint látjuk, az ezen minta szerint létrejövő szálváltás eredményeként a kapott eredményünk hibás lesz. Sajnos, nincs arra mód, hogy a szálváltás helyét pontosan meghatározhassuk, beállíthassuk, még igazából azt sem tehetjük meg, hogy megakadályozzuk, hogy bekövetkezzen a szálváltás. Ez utóbbihoz nagyon hasonló tevékenységet azonban végezhetünk. Kialakíthatunk ún. védett blokkokat.

Egy védett blokkba egy vagy több C# utasítás tartozhat (akár egy vagy több ciklus is, alkalmasint függvényhívásokat is tartalmazhat). A védett blokkba belépéshez egy zárolást kell végrehajtani valamilyen memóriaterületre, majd a védett blokkból kilépés közben ezen zárolást fel kell oldani. Egy időben adott memóriaterületen csak egyetlen zárolás lehet aktív. Amennyiben egy szál zárolást kezdeményezne, de az aktuálisan nem kivitelezhető – úgy ezen szál alvó (sleep) állapotba lép mindaddig, amíg a zárat fel nem oldják.

A védelem lényege, hogy mindkét szál megpróbál zárolást kivitelezni a saját osszeg = osszeg + t[i]; utasítása köré. Mivel egy időben csak egy zár lehet aktív, amelyik szál hamarabb kezdeményezi a zárolást, az lép be a saját védett blokkjába. A másik szál a blokkba lépési kísérlete esetén alvó állapotba kerülne mindaddig, míg az első szál ki nem lép a védett blokkból, és fel nem oldja a zárat.

A védett blokkot alapvetően két módon lehet kivitelezni C#-ban. Az egyik módot a lock kulcsszó használata, a másikat a Monitor osztály metódusainak alkalmazása jelenti. A két módszer eredménye ekvivalens. Ennek legfőbb oka, hogy a lock kulcsszó a fordítás során a Monitor osztály megfelelő metódushívásaira (Enter, Exit) cserélődik le[9] a 3.2. forráskódban bemutatott minta szerint.

3.2. forráskód. try vs. Monitor.Enter() + Monitor.Exit()

     
// ---------- az eredeti forráskód 
lock{valami) 
{ 
 ... 
} 
 
// ---------- a generált kód pedig 
Monitor.Enter(valami); 
try 
{ 
  ... 
} 
finally 
{ 
   Monitor.Exit(valami); 
}
    
                                                                                                                                               

                                                                                                                                               
    

Mindkét módszerhez szükségünk van egy memóriaterületre, amelyre a zárolást rátehetjük. A memóriaterületeket magas szintű programozási nyelveken változókkal tudjuk hivatkozni, tehát szükségünk van változóra. Fontos, hogy mindkét szál ugyanazon memóriaterületre próbálja rátenni a zárolást, tehát olyan változóra van szükségünk, amely mindkét szálban elérhető, közös. Erre legalkalmasabbnak az osztályszintű mezők (static) tűnnek, de példányszintű mezőt is használhatunk, ha az mindkét szálban elérhető. Gyakori hiba, hogy a szálfüggvényekben definiált lokális változókra hivatkozunk, amelyek nevükben (is) megegyezhetnek. Vegyük azonban észre, hogy a két szálfüggvényben definiált lokális változók nem ugyanazon memóriaterületen helyezkednek el, így hiába azonos a nevük, a rájuk elhelyezett zárolások nem fognak ütközni, így eredményt nem lehet elérni a segítségükkel.

Szintén gyakori a zárolást a typeof segítségével megvalósítani. A typeof egy operátor, paramétere egy osztály neve. A typeof az adott nevű osztályhoz elkészíti, lekéri a típusleíró példányt. Ezen példányon keresztül számtalan információ lekérhető az adott osztályról (pl. hány konstruktor van benne definiálva, milyen mezői vannak stb.). Számunkra most nem az információ kinyerése a fontos jelen esetben, hanem a típust leíró példány. Ugyanis ezen példány adott memóriaterületen helyezkedik el, melyre zárolás készíthető. A zárolásnak valójában semmi köze nincs az adott osztály nevéhez ilyen módon, őt csak kihasználjuk ebben az esetben – a típusleíró példánya azonban garantáltan közös bármely szálak között.

3.3. forráskód. Vektorra zárolás

 
static void osszeg_1() 
{ 
 lock (tomb) 
 { 
   for (int i = 0; i < tomb.Length / 2; i++) 
      osszeg = osszeg + tomb[i]; 
 } 
}

3.4. forráskód. Typeofra zárolás

 
static void osszeg_2() 
{ 
   lock (typeof(Program)) 
   { 
      for (int i = tomb.Length / 2; i < tomb.Length; i++) 
         osszeg = osszeg + tomb[i]; 
   } 
}

A lock alkalmazása során ügyeljünk arra, hogy minél rövidebb ideig legyen érvényben, hiszen ezen idő alatt a másik szál ugyanezen memóriaterületre kiadott lockja nem érvényesülhet, és várakozni kényszerül (blokkolódik). A blokkolás a hatékonyság rovására megy, mely jelen esetben az egyik legfontosabb célunk. Tekintsük át például a 3.5. példát, melynél a lockolást a két szál kissé túlzásba vitte!

3.5. forráskód. Mindkét szál teljes ciklusra zárol

     
static void osszeg_1() 
{ 
 lock (tomb) 
 { 
   for (int i = 0; i < tomb.Length / 2; i++) 
      osszeg = osszeg + tomb[i]; 
 } 
} 
 
static void osszeg_2() 
{ 
   lock (tomb) 
   { 
      for (int i = tomb.Length / 2; i < tomb.Length; i++) 
         osszeg = osszeg + tomb[i]; 
   } 
}
    

A 3.2. videón látható futáshoz a programot annyiban módosítottuk, hogy az első szálban lévő for ciklus belsejébe egy zöld színű pont karakter kiírása, a második szálban sárga színű ~ karakter kiírása történik (minden 500-adik lefutáskor). A futás elemzése során látszik, hogy a két szál közül csak az egyik tud belépni a védett blokkba, a másik szál várakozni kényszerül. Ennek következménye, hogy bár két szálat készítettünk, egy időben lényegében csak az egyik szál képes hasznos ténykedést végezni, a két ciklus időben csak egymás után lesz képes végrehajtódni – így a teljes futási idő lényegében a szekvenciális változattal lesz egyező.

Nem segít sokat, ha az előbbi példában szereplő lockot a ciklus belsejébe (a 3.6. forráskód, 3.3. videó), a ténylegesen védendő utasításhoz közelebb mozgatjuk. Mivel a ciklusmag lényegében ezen egyetlen utasításból áll, és a ciklus járulékos adminisztrációja (a ciklusváltozó növelése, a feltételvizsgálat) elhanyagolhatóan kevés időt vesz igénybe, a két szál továbbra is erősen akadályozza egymást.

3.6. forráskód. Ciklusmag zárolása

 
static void osszeg_1() 
{ 
 for (int i = 0; i < tomb.Length / 2; i++) 
   lock (tomb) 
   { 
    osszeg = osszeg + tomb[i]; 
   } 
} 
 
static void osszeg_2() 
{ 
 for (int i = tomb.Length / 2; i < tomb.Length; i++) 
   lock (tomb) 
   { 
    osszeg = osszeg + tomb[i]; 
   } 
}

Az algoritmus átgondolása ezen szempontból sokat tud a helyzeten segíteni. Amennyiben segédváltozót alkalmaznánk a két szálban a részösszeg képzésére, azokat már nem kell egymás elől védett blokkba helyezni – hiszen ezen segédváltozók lokálisak, nem közösek a két szál között. A segédváltozókból a végén egyetlen értékadó utasítással a közös gyűjtő változóba helyezhetőek át az összegek – így az egymás akadályozása csak rövid ideig léphet fel (3.4. videó).

A teljesség igényét szem előtt tartva jegyezzük meg, hogy konkrétan az ilyen jellegű problémáknál az Interlocked osztály metódusai tudnának segíteni. Ebben az esetben pl. az Add metódus, amely két egész szám értéket képes összeadni, és az eredményt az első paraméterben megadott változóba helyezi el. E miatt az első paramétere átmenő típusú, ref kulcsszavas. Így az osszeg = osszeg + tomb[i] kódsort a Interlocked.Add(ref osszeg, tomb[i]); sorra cserélhetnénk. Az Interlocked metódusai elemi (atomi) műveletként kerülnek végrehajtásra. Az atomi műveletek nem kerülhetnek megszakításra, nem következhet be a végrehajtásuk alatt szálváltás, így ezen időre lock-t sem igényelnek. Használatukkal a fenti példa triviálisan megoldható lett volna.

3.7. forráskód. Helyes megközelítés

     
static void osszeg_1() 
{ 
 int sum=0; 
 for (int i = 0; i < tomb.Length / 2; i++) 
    sum = sum + tomb[i]; 
 // 
 lock (tomb) 
 { 
    osszeg = osszeg + sum; 
 } 
} 
 
static void osszeg_2() 
{ 
 int sum=0; 
 for (int i = tomb.Length / 2; i < tomb.Length; i++) 
    sum = sum + tomb[i]; 
 // 
 lock (tomb) 
 { 
    osszeg = osszeg + sum; 
 } 
}
    

Komplex probléma

Tervezzünk és írjunk olyan programot, amely egy 1000 elemű egész szám vektort feltölt véletlen egész számokkal az intervallumból, majd meghatározza az elemek minimumát, és hogy ezen legkisebb érték hányszor szerepel a vektorban! A minimumkeresést két szálon végezzük oly módon, hogy az első szál a vektor első felén, a második szál a második felén keressen minimumot, majd a végén egyeztessék a két részeredményt! A program írja ki a képernyőre a vektorbeli legkisebb értéket és az előfordulási számot! A két szál futási végeredményét ellenőrizzük le szekvenciális módon!

A feladat egyfajta megoldását a 3.8. forráskódban olvashatjuk. Ha azonban figyelmesen elolvassuk és megértjük a megoldást, akkor ki fog derülni, hogy valójában nagyon gyenge a kód minősége. A két szál for ciklusán belül van a lock, így a két szál folyamatosan zavarja egymás működését. Egy javított, ezen szempontból jobban átgondolt változat szerepel a a 3.10. forráskódban.

3.8. forráskód. A minimumkeresés egyik megoldása – 1. rész

 
using System; 
using System.Threading; 
 
class Program 
{ 
   static int[] vektor = new int[1000]; 
   static Random rnd = new Random(); 
   static int min = 0; 
   static int db = 0; 
   static void Main(string[] args) 
   { 
      feltoltes(); 
      min = int.MaxValue; 
      db = 0; 
      Thread t1 = new Thread(keres_1); 
      t1.Start(); 
      Thread t2 = new Thread(keres_2); 
      t2.Start(); 
      t1.Join(); 
      t2.Join(); 
      Console.WriteLine("minimum={0},␣db={1}", min, db); 
      if (legkisebb()) Console.WriteLine("A␣megoldas␣JO"); 
      else Console.WriteLine("A␣megoldas␣NEM␣JO!"); 
      Console.ReadLine(); 
   } 
   // 
   static void feltoltes() 
   { 
      for (int i = 0; i < vektor.Length; i++) 
         vektor[i] = rnd.Next(1000, 2000); 
   } 
   // 
   // ... folyt köv ...

3.9. forráskód. A minimumkeresés egyik megoldása – 2. rész

                                                                                                                                     

                                                                                                                                     
     
   // .. folytatás .. 
   static void keres_1() 
   { 
      for (int i = 0; i < 500; i++) 
      { 
         lock (typeof(Program)) 
         { 
            if (min > vektor[i]) 
            { 
               min = vektor[i]; 
               db = 1; 
            } 
            else if (min == vektor[i]) mdb++; 
         } 
      } 
   } 
   // 
   static void keres_2() 
   { 
      for (int i = 500; i < 1000; i++) 
      { 
         lock (typeof(Program)) 
         { 
            if (min > vektor[i]) 
            { 
               min = vektor[i]; 
               db = 1; 
            } 
            else if (min == vektor[i]) mdb++; 
         } 
      } 
   } 
   // 
   static bool legkisebb() 
   { 
      int bb = 0; 
      foreach (int x in vektor) 
      { 
         if (x == min) bb++; 
         if (x < min) return false; 
      } 
      if (bb != db) return false; 
      return true; 
   } 
} // end of class Program
    

3.10. forráskód. A minimumkeresés másik megoldása – 1. rész

 
using System; 
using System.Threading; 
 
class Program 
{ 
   static int[] vektor = new int[1000]; 
   static Random rnd = new Random(); 
   static int min = 0; 
   static int db = 0; 
   static void Main(string[] args) 
   { 
      feltoltes(); 
      min = int.MaxValue; 
      db = 0; 
      Thread t1 = new Thread(keres_1); 
      t1.Start(); 
      Thread t2 = new Thread(keres_2); 
      t2.Start(); 
      t1.Join(); 
      t2.Join(); 
      Console.WriteLine("minimum={0},␣db={1}", min, db); 
      if (legkisebb()) Console.WriteLine("A␣megoldas␣JO"); 
      else Console.WriteLine("A␣megoldas␣NEM␣JO!"); 
      Console.ReadLine(); 
   } 
   // 
   static void feltoltes() 
   { 
      for (int i = 0; i < vektor.Length; i++) 
         vektor[i] = rnd.Next(1000, 2000); 
   } 
   // ... folyt. köv ...

3.11. forráskód. A minimumkeresés másik megoldása – 2. rész

 
   // ... folytatás ... 
   static void keres_1() 
   { 
      int mmin = int.MaxValue; 
      int mdb = 0; 
      for (int i = 0; i < 500; i++) 
      { 
         if (mmin > vektor[i]) 
         { 
            mmin = vektor[i]; 
            mdb = 1; 
         } 
         else if (mmin == vektor[i]) mdb++; 
      } 
      lock (typeof(Program)) 
      { 
         if (min == mmin) db = db + mdb; 
         else if (min > mmin) 
         { 
            min = mmin; 
            db = mdb; 
         } 
      } 
   } 
 
   // ... folyt. köv. ...

3.12. forráskód. A minimumkeresés másik megoldása – 3. rész

 
   // ... folytatás ... 
   static void keres_2() 
   { 
      int mmin = int.MaxValue; 
      int mdb = 0; 
      for (int i = 500; i < 1000; i++) 
      { 
         if (mmin > vektor[i]) 
         { 
            mmin = vektor[i]; 
            mdb = 1; 
         } 
         else if (mmin == vektor[i]) mdb++; 
 
      } 
      lock (typeof(Program)) 
      { 
         if (min == mmin) db = db + mdb; 
         else if (min > mmin) 
         { 
            min = mmin; 
            db = mdb; 
         } 
      } 
   } 
   // 
   static bool legkisebb() 
   { 
      int bb = 0; 
      foreach (int x in vektor) 
      { 
         if (x == min) bb++; 
         if (x < min) return false; 
      } 
      if (bb != db) return false; 
      return true; 
   } 
} // end of class


[9] az ilyen megoldásokat szintaktikai cukorkának (syntactic sugar) nevezik

4. fejezet - Étkező filozófusok

Az étkező filozófusok problémája egy olyan hétköznapi életbeli kérdés, melyet könnyen és gyorsan meg lehet érteni, de melynek felmerülő problémái valós informatikai problémákká növik ki magukat.

Egy kolostorban öt filozófus él. Minden idejüket egy asztal körül töltik. Mindegyikük előtt egy tányér, amelyből sohasem fogy ki a rizs. A tányér mellett jobb és bal oldalon is egy-egy pálcika található a 4.1. ábra szerinti elrendezésben.

4.1. ábra. Étkező filozófusok

A filozófusok életüket az asztal melletti gondolkodással töltik. Amikor megéheznek, étkeznek, majd ismét gondolkodóba esnek a következő megéhezésig. És ez így megy az idők végezetéig. Az étkezéshez egy filozófusnak meg kell szereznie a tányérja melletti mindkét pálcikát. Ennek következtében amíg eszik, szomszédai nem ehetnek. Amikor befejezte az étkezést, leteszi a pálcikákat, amelyeket így szomszédai használhatnak.

Elemezzük ki, hogy mely problémákkal szembesülhetnek a filozófusaink, ha nem tartanak be rajz szabályokat az asztal körül:

  • (holtpont) előfordulhat-e olyan eset, amikor a filozófus nem eszik, és nem is gondolkodik?

  • (kiéheztetés) előfordulhat-e olyan eset, hogy a filozófus éhen hal?

Látni fogjuk, hogy míg a holtpont kialakulása, kezelése abszolút a programozók felelőssége és feladata, addig a kiéheztetés kérdését elsősorban az operációs rendszernek kell kezelnie.

Holtpont

Egy rosszul felépített rendszerben előfordulhat az a helyzet, hogy minden filozófus egyszerre éhezik meg. Tegyük fel, hogy a filozófusok a 4.2. ábrán leírt módon kezdenek étkezni!

4.2. ábra. Evés algoritmusa

A gond a következő: előfordulhat olyan eset, hogy minden filozófus egyszerre kezd el étkezni. Mi történik ekkor? Ha a fenti algoritmus közel egy időben kezd el végrehajtódni minden filozófus esetén, akkor első lépésben mindegyik filozófus egy időben néz le az asztalára, és maga előtt látja a saját pálcikáját. Felveszi, magasba emeli. Majd átnéz a szomszédjához, de annak már nincs lenn a pálcika. Várakozni kezd hát. De meddig?

A várakozás addig tart, amíg a szomszéd a pálcikát le nem rakja. Ez általában hamar bekövetkezik, hiszen a szomszéd általában eszik. Amikor befejezi, lerakja a pálcikát. Csakhogy most a szomszéd nem eszik, ő is várakozik.

Képzeljük el a fenti szituációt két filozófus esetén. Mindkettő felemelte a saját pálcáját, és mindkettő várja, hogy a másik lerakja végre a második pálcikát. Az algoritmus szerint mindkét filozófus ekkor a várakozó ciklusba fog beragadni az idők végtelenségéig.

Ezt a helyzetet nevezi az informatika deadlock-nak, amit halálos szorításnak fordíthatnánk, de a hivatalos terminológia szerint ezt holtpontra magyarosítottuk.

A holtpont fellépéséhez legalább két folyamatra van szükség: és . Holtpont akkor lép fel, amikor folyamat várakozik a folyamat valamely állapotváltozására, miközben a a állapotváltozására vár. Ha mindkét folyamat hajlamos a végtelen várakozásra, akkor ez mindkét folyamat végtelen ideig történő várakozásához vezet.

A filozófusok esetén (hétköznapi esetben) a megoldás egyszerű: valamelyik filozófusnak majd csak eszébe jut, hogy megnézze, mit csinálnak a többiek. Amennyiben észreveszi a problémát, és belátja, hogy valakinek meg kell szakítani a várakozást, és hajlandó is feláldozni magát, úgy lerakja a saját pálcikáját egy pillanatra. Ezzel megtöri a várakozást, és láncreakciót indít el, hiszen ekkor az ő szomszédja felveszi, étkezik, és lerakja mindkét pálcikát. Ekkor a következő filozófus tud majd enni, és ha már mindenki evett (körbe ért), akkor az áldozatot vállaló filozófus is étkezhet végre.

Az informatikában hasonló helyzet áll elő az Ethernet hálózatok esetén. Ott egy HUB-ra kapcsolva több hálózati kártya is fellelhető, melyek a HUB-on keresztüli összekapcsolás révén úgy is elképzelhetőek, mintha egyetlen kábelre lenne felfűzve mindegyik hálózati eszköz. A probléma akkor lép fel, amikor egy időben több kártya is kezdeményezni szeretne hálózati forgalmat, adatcsomagot kívánna küldeni. Mivel egy kábelen egy időben zavarásmentesen csak egy csomag közlekedhet, egyik kártyának sem sikerülne az üzenetküldés.

Nem lenne megoldás, ha ekkor a kártyák mindegyike ugyanannyi ideig kezdene várakozni, majd újra próbálkozna az üzenetküldéssel – hiszen akkor az újra meghiúsulna. Ehelyett a kártyák sorsot húznak, véletlen (random) ideig várakozni kezdenek. Az egyik kártya valószínűleg rövidebb időt kap a véletlen értékek közül, így a rövid várakozás után neki már sikerülni fog az üzenetküldés, amíg a másik kártya még csendben várakozik. Ha mindkét kártya ugyanannyi ideig várakozik random módon, akkor persze a második próbálkozás is kudarc lesz. Ekkor újra választanak maguknak várakozási időt, most már egy nagyobb intervallumból (kisebb az esély az egyforma értékekre). Ezt csak néhányszor vállalják fel, ha annyi idő alatt nem sikerül az üzenetküldés, akkor feladják.

Ezen megoldás érdekessége, hogy a két részt vevő kártya miután detektálja a problémát, nem cserélnek egymással információt, mégis megpróbálják megoldani a deadlockot. Egyszerűbb ötletnek tűnne, hogy a két kártya beszélje meg, ki mennyi ideig várakozzon, és állapodjanak meg egy eltérő időben. Csakhogy nyilván ez nem tud működni ebben az esetben, hiszen a két kártya pont azért került összeütközésbe, mert egyszerre kívántak adatforgalmazni ugyanazon az átvivő közegen, így egymással sem tudnak adatcsomagot cserélni. Másrészt minden ilyen megbeszélés során valamelyiknek engednie kell a másik javára. Egyik kártyának vezető beosztásba kell kerülnie, hogy a döntését és akaratát a másik kártyára rákényszeríthesse. A vezetőválasztás újabb üzenetváltásokat jelentene, így összességében nem lennénk korábban készen.

A deadlock szituáció könnyen fellép többszálú programok esetén akkor, ha mindkét szál két zárat is próbál szerezni – de eltérő sorrendben (lásd a 4.3. ábra). Amennyiben a külső lock-ot a két szál nagyjából egy időben éri el, mindkettő megszerzi a számára első lockot, akkor a második megszerzése már reménytelen.

4.3. ábra. Deadlock két szál között

4.1. videó. Deadlock teszt

A 4.1. videón látható, amint a két szál próbál különböző sorrendben zárolni a két erőforrást. A 11. tesztfutás során kialakul a holtpont.

Ezen futási eredmény egyébként ritka. A két szálnak egy időben kell elérni a külső lock utasítást. Ha az egyik kicsit gyorsabb, megszerzi mindkét lockot mielőtt a második belekezdene a saját külső lockjába, akkor máris rendben vagyunk, hiszen a külső lockját sem tudja megszerezni, és várakozni kezd. Amikor a gyorsabb elkészül, már mindkét zárat felszabadítja, így a lassúbb szál is meg tudja mindkettőt szerezni.

Ezt úgy kell elképzelni, hogy a programunk 50 indításból 50 esetben hibátlannak bizonyul. Az 51-edik alkalommal deadlock alakul ki, és lefagy. Az újabb tesztelések azonban megint csak képtelenek ezt az esetet reprodukálni. Ha a programot elkezdjük debugolni, lépésenként végrehajtani, szinte biztos, hogy nem lesz pontosan ez az eset, hiszen ekkor a szálváltások biztosan nem ugyanakkor következnek be, mint valós futási környezetben. A nehezen vagy egyáltalán nem reprodukálható hibák a tesztelők és a fejlesztők rémálma. Persze léteznek olyan eszközök, melyek nagy biztonsággal képesek a kód elemzésével megjósolni, hogy a program hordozza-e a deadlock kialakulásának esélyét. Amennyiben a fejlesztést formális specifikáció és bizonyított programtulajdonságok alapján végezzük, úgy a deadlockmentességet formális eszközökkel bizonyítani kell.

Kiéheztetés

Kiéheztetés akkor fordul elő, amikor udvarias filozófusok ülnek az asztal körül. Az udvarias filozófusok vagy nem veszik kézbe a pálcikájukat, csak ha mindkét pálcikát egy időben sikerül megszerezni, vagy ha az első pálcika után a másodikat nem sikerül felvenni, akkor az elsőt leteszik, és türelmesen várnak.

Ekkor előállhat az az eset, hogy egy filozófus szomszédai összefognak (akaratlanul is akár) ellene. Amikor a filozófus étkezik, akkor a nyilván nem tud, mert nincs meg a bal oldali pálcikája. Amikor a befejezi, a , a másik szomszéd azonnal elkezd enni, ekkor meg a jobb oldali pálcikát nem sikerül megszerezni. Ha felváltva folyamatosan hol az egyik oldali, hol a másik oldali filozófus étkezik, akkor bizony a sosem tud enni. Éhen hal.

Az informatikában ez elsősorban az operációs rendszer problémája. Konkrétan arról van szó, hogy a korábbi fejezetben ismertetett lock utasítás kezdetekor a szál megpróbál zárat létrehozni. Amennyiben nem sikerül a zár létrehozása, a szál sleep, alvó üzemmódba lép. Ebből az állapotból az operációs rendszer ébreszti fel, amikor olyan változás következik be, ami akár lehetővé teszi a zár létrehozását. A szál ekkor újra megpróbálja a zárat létrehozni.

Amennyiben több szál is próbálkozik ugyanazon zár létrehozásával (a pálcika felvételével), úgy egyikük megkapja a zárat, a többi alvó üzemmódba lép. Ezek a , , szálak. Ha az operációs rendszer nem kezeli ügyesen a szituációt, akkor hol a , hol a szálnak sikerül a zárat megszereznie, a pedig mindig hoppon marad, és alvó üzemmódba lép.

A kiéheztetés során a szál sosem képes elérni a befejezett állapotát, mely a program összműködését minden bizonnyal zavarja, és hibás végeredményt okozhat.

Az operációs rendszerek ezért megpróbálnak ez ellen védekezni. Sajnos a probléma nem teljesen egyszerű, hiszen a szálaknak prioritásuk is van. Amennyiben a és szálak magasabb prioritásúak, mint a , úgy könnyen indokolható, hogy miért kerülnek előnybe.

Hasonló a gond a hálózati nyomtatási sorokkal. A hálózati felhasználók esetén is prioritásokat osztanak a különböző felhasználóknak, nyilvánvalóan a menedzserek prioritása magasabb, mint az egyszerű adminisztrátoroké. Amennyiben egy időben több felhasználó is küld be nyomtatási feladatot a cég egyetlen nyomtatójára, a magasabb prioritású felhasználóé fog először kijönni a nyomtatóból. Ha azonban a menedzserek folyamatosan terhelik a nyomtatót feladatokkal, akkor sem szabad az egyszerű irodista feladatát a végtelenségig hátul tartani, annak is előbb-utóbb ki kell jönnie a nyomtatóból. Legegyszerűbb kezelési módja ennek a problémának az, hogy minden olyan esetben, amikor az alacsony szintű felhasználó feladatát egy később érkezett magasabb prioritású feladat háttérbe szorítja, az alacsonyabb prioritás értéke növekszik egyet. Így előbb-utóbb olyan magas prioritásra lép, hogy a vezető menedzser nyomtatási feladata sem tudja már többé megelőzni. Egyéb módszerek is léteznek, de mivel ez elsősorban az operációs rendszerek problémája, így ezen jegyzet a továbbiakban nem tárgyalja ezt a témakört.

5. fejezet - Termelő-fogyasztó probléma

Egy tipikus probléma, amely a többszálú programozás egyik legjellemzőbb problémája, s melynek megoldása érdekes, tanulságos.

A feladat az alábbi módon fogalmazható meg: egy rendszerben szál végez úgynevezett termelő feladatot, futásuk során rendre adatokat állítanak elő valamiféle számítási műveletek révén. Az adatok további elemzését, feldolgozását azonban már nem ők végzik, hanem más szálakon futó kódok, melyekből darab van. Őket nevezzük fogyasztó szálaknak. A feladat: a termelők által előállított adatokat át kell adni a fogyasztóknak feldolgozásra.

A feladatot próbáljuk meg jó minőségben megoldani! A termelők és fogyasztók száma nem feltétlenül egyforma (). Nincs tehát egyszerű összepárosítási lehetőség, nem tudunk egy-egy termelőt és fogyasztót összekötni. Ehelyett a megoldást az nyújtja, hogy a termelők által előállított értékeket bedobjuk a közösbe, egy kalapba, egy gyűjtőbe (lásd az 5.1. ábra). A fogyasztók oda járnak az értékeket kivenni és feldolgozni.

A gyűjtő tárolási kapacitása természetesen véges (az informatikában minden véges, még az is, ami nem annak tűnik). Ez azt jelenti, hogy amennyiben a gyűjtő megtelt, és valamely termelő szálnak (szálaknak) újabb értékeket sikerült előállítani, akkor várakozniuk kell, amíg szabadul fel tárolókapacitás. Ez akkor adódik, ha a termelők gyorsabban dolgoznak, mint a fogyasztók. Hasonlóan, ha a gyűjtő teljesen kiürül, és egy (vagy több) fogyasztó szál is képes lenne elemet kivenni és feldolgozni, akkor várakozni fognak.

5.1. ábra. Gyűjtő működési vázlata

A gyűjtő tehát egyúttal egyfajta erőforrás-menedzser feladatokat is ellát. Amennyiben a termelő szálak gyorsabban működnek, mint a fogyasztó szálak, úgy automatikusan lelassulnak, alvó állapotra váltanak a gyűjtő folyamatos telítettsége miatt. A processzor felszabaduló idejét a termelő szálakra tudja koncentrálni, így a gyűjtő gyorsabban ürül. Ha a gyűjtő kiürül, a fogyasztó szálak állnak le egyre gyakrabban, és alvó állapotban várakoznak az adatok érkezésére. Ekkor a termelő szálak kapnak több processzoridőt.

Egy jól kiegyensúlyozott rendszerben a gyűjtő ritkán telik be, és ritkán ürül ki teljesen. Ezért is van eltérő számú termelő és fogyasztó szál. A termelők feladata, az adatok előállítása a számolásigény miatt általában nehezebb és lassabb folyamat, a feldolgozók jellemzően hamarabb végeznek a feldolgozással. Ezért a termelők száma általában nagyobb, mint a feldolgozóké. Természetesen konkrét esetben ez akár fordítva is lehet, tehát általános szabály erre nem fogalmazható meg. Ugyanakkor PC-s környezetben univerzális és arányt találni sem lehet. Az egyik gép több memóriával rendelkezik, a másikban a processzor az erősebb teljesítményű, másoknál a diszk a lassú. Az egyik PC-re belőtt alkalmazás egy másik PC-n már nem feltétlenül fut jól kiegyensúlyozott módon.

Ehelyett elképzelhető egy olyan felügyeleti rendszer, amely induláskor valamely és értékekkel inicializálja a rendszert, majd figyelemmel kíséri a gyűjtő telítettségét. Amennyiben úgy találja, hogy a gyűjtő gyakran és hosszú ideig van tele, a termelő szálak túl sokat várakoznak az elem behelyezésére, leállít közülük néhányat, vagy több fogyasztó szálat indít el. Adott teljesítményű processzoron adott mennyiségű szál fut optimálisan. A túl sok szál túl sok szálváltást jelent, mely önmagában teljesítménycsökkentő hatású.

Megvalósítás

A gyűjtőt párhuzamos környezetben egy egyszerű lista adatszerkezettel is meg lehet valósítani. A termelők az Add metódussal helyeznek elemet a listába, míg a fogyasztók az elemet a Remove függvénnyel tudják eltávolítani a listáról. A lista elemszámát a Count tulajdonság mutatja, így könnyű megállapítani, hogy a gyűjtő üres-e. A gyűjtő tele állapotát már kicsit bonyolultabb, ugyanis a lista alapvetően nem korlátos elemszámú, így maga a lista sosem lesz tele (de mint tudjuk, az informatikában minden véges). A tele állapotot úgy tudjuk ellenőrizni, hogy előre elhatározzuk, hány elemnél tekintjük a listát teli állapotúnak, és a Count elemszámot összevetjük ezzel a konstans értékkel.

A lista természetesen közös kell, hogy legyen a szálak között, erre célszerű osztályszintű (static) változót használni. Az elem behelyezését az Add úgy oldja meg, hogy a lista végéhez fűzi hozzá az új elemet. Amennyiben eltávolításkor a nullás sorszámú elemet vesszük ki, a lista a maradék elemeit lejjebb lépteti. Vagyis a listánk úgy van szervezve, hogy minél kisebb sorszámú egy listaelem, annál régebben került be a listába. A 0. elem a legrégebbi elem. Ha mindig a legrégebbi elemet vesszük ki, az új elemet pedig mindig a lista végéhez illesztjük hozzá, akkor a működés egyezik a QUEUE (sor) adatszerkezet működésével (lásd az 5.1. forráskód).

5.1. forráskód. Gyűjtő osztály a két alapművelettel – vázlat

     
class Gyujto 
{ 
 static List<double> lista = new List<double>(); 
 const int maxMeret = 50; 
 
 public static double kivesz() 
 { 
   if (lista.Count==0) 
   { 
    // baj van, nincs elem 
    return 0.0; // ?? 
   } 
   else 
   { 
     double x = lista[0]; 
     lista.RemoveAt(0); 
     return x; 
   } 
 } 
 
 public static void berak(double x) 
 { 
   if (lista.Count>=maxMeret) 
   { 
    // baj van, tele a gyujto 
   } 
   else 
   { 
    lista.Add(x); 
   } 
 } 
}
    

Több nyitott kérdést is meg kell még oldani. Először is vegyük észre, hogy akár a berak, akár a kivesz műveletet vizsgáljuk, mindkettőnél előfordulhat, hogy a szálműveletek egy időben kerülnek végrehajtásra! Egy időben akár több termelő szál hívhatja a berak műveletet az új előállított érték tárolása miatt, akár több fogyasztó szál is szeretne új értéket lehívni a gyűjtőből, ill. akár egy időben futhat a termelő szál berak és a fogyasztó szál kivesz művelete.

Ezt azért fontos tisztázni, mert a listának mind az Add, mind a Remove művelete összetett művelet. Egy időben nem indíthatunk el párhuzamosan sem Add, sem Remove műveleteket. Ezt nem a lista akadályozza meg, erről a programozónak kell gondoskodnia. Ha erről elfelejtkezünk, az a lista összeomlásához, futási hibához, kivételek keletkezéséhez vezet.

Próbálkozzunk, hátha a lock utasítás segíthet! Próbáljuk meg a berak és a kivesz műveleteket is a lock segítségével védeni, és ez minimálisan szükséges is (lásd az 5.2. forráskód). De a problémás részek megoldásában ez nem segít.

5.2. forráskód. Gyűjtő osztály a lock használatával – vázlat

     
class Gyujto 
{ 
   static List<double> lista = new List<double>(); 
   const int maxMeret = 50; 
 
   public static double kivesz() 
   { 
      if (lista.Count == 0) 
      { 
         // baj van, nincs elem 
         return 0.0; // ?? 
      } 
      else 
      { 
         double x; 
         lock (lista) 
         { 
            x = lista[0]; 
            lista.RemoveAt(0); 
         } 
         return x; 
      } 
 
   } 
 
   public static void berak(double x) 
   { 
      if (lista.Count >= maxMeret) 
      { 
         // baj van, tele a gyujto 
      } 
      else 
      { 
         lock (lista) 
         { 
            lista.Add(x); 
         } 
      } 
   } 
}
    

Hogy kezeljük a kivesz függvény azon esetét, amikor nincs elem a listában? A vázlatban írt megoldás értelemszerűen nem jó. A korábbiak szerint nekünk ilyenkor nem szabad értékkel visszatérnünk, hiszen nem ezt várják el tőlünk, ez esetben addig kell várakoznunk, amíg elem nem kerül a gyűjtőbe. Fokozottan igaz ez a berak függvény esetén, amikor is a várakozás azért fontos, hogy a berakandó elem () ténylegesen be is kerüljön a gyűjtőbe.

A korábban ismertetett busy-waiting technika adná magát, csakhogy azt is megbeszéltük már, hogy ennek használata megold ugyan problémákat, de újakat is generál (az 5.3. forráskód). A kódban szereplő while ciklusokkal várjuk ki, amíg a megfelelő elemszám ki nem alakul a gyűjtőben. Eközben másodpercenként több ezerszer ellenőrizzük a lista elemszámát, foglalva ezzel a processzoridőt.

5.3. forráskód. Busy waiting alkalmazása – vázlat

 
class Gyujto 
{ 
   static List<double> lista = new List<double>(); 
   const int maxMeret = 50; 
 
   public static double kivesz() 
   { 
      double x; 
      // varakozas mig ures 
      while (lista.Count == 0) 
         ; 
      // van elem 
      lock (lista) 
      { 
         x = lista[0]; 
         lista.RemoveAt(0); 
      } 
      return x; 
   } 
 
   public static void berak(double x) 
   { 
      // varakozas amig lesz ures hely 
      while (lista.Count >= maxMeret) 
         ; 
      // van ures hely 
      lock (lista) 
      { 
         lista.Add(x); 
      } 
   } 
}

Igazából van egy másik problémánk is ezzel a megoldással. Gondoljuk végig alaposabban a kivesz eljárás működését! Az első while ciklus addig nem engedi tovább a függvény végrehajtását, amíg a lista elemszáma nulla. Utána lockot helyezünk a listára, amíg az elem eltávolítása tart. De előfordulhat olyan eset is, hogy két szálon is fut két fogyasztó, és mindkettő a saját while ciklusában várakozik az elemre. Egyetlen termelő szálunk végre előállít egy elemet, és berakja azt a gyűjtőbe. Ekkor mindkét fogyasztó szál továbblendül, az egyik picit gyorsabb lesz, és sikeresen felhelyezi a saját lockját, majd ténylegesen kiveszi ezt az elemet. A másik, picit lassabb szál nem tudja eközben a saját lockját felhelyezni, így várakozni kezd. Amikor végre sikerül felhelyezni a lockot, addigra az elemszám megint csak nulla, tehát nem fog sikerülni neki az elemhez való hozzájutás.

Valójában a while ciklust és az elemeltávolítás lépéssorozatát is bele kellene foglalni a lock-ba. Hasonlóan belátható, hogy a berak sem működik jól, ha a while ciklusa a lock-on kívül van, ott is egyetlen összetett utasítássá kell alakítani a teljes függvénytörzset (az 5.4. forráskód).

5.4. forráskód. Javított, biztonságosabb működés

     
class Gyujto 
{ 
   static List<double> lista = new List<double>(); 
   const int maxMeret = 50; 
 
   public static double kivesz() 
   { 
      double x; 
      lock (lista) 
      { 
         // varakozas mig ures 
         while (lista.Count == 0) 
            ; 
         // van elem 
         x = lista[0]; 
         lista.RemoveAt(0); 
      } 
      return x; 
   } 
 
   public static void berak(double x) 
   { 
      lock (lista) 
      { 
         // varakozas amig lesz ures hely 
         while (lista.Count >= maxMeret) 
            ; 
         // van ures hely 
         lista.Add(x); 
      } 
   } 
}
    

A problémák azonban csak most kezdődnek. Ugyanis most az történik, hogy ha belép egy fogyasztó a kivesz eljárásba úgy, hogy éppen nincs elem a gyűjtőben, akkor felhelyezi a lock-ot, és elkezd busy waiting-gel várni az elemre. De eközben a termelők hiába készülnek el az elemmel, nem tudják azt elhelyezni a listába, hiszen nem tudják a saját lock-jukat felhelyezni.

Hasonló probléma van, ha a termelők a gyorsabbak. Tegyük fel, hogy a gyűjtő tele van, amikor egy újabb termelő szál lép be a berak eljárásba! A while ciklusban elkezd várakozni, hogy képződjön szabad hely a gyűjtőben, de közben folyamatosan fenntartja a lock-ot, így a fogyasztók nem tudják kivenni az elemeket.

Ezzel a módszerrel itt nagyjából zsákutcába jutottunk. Megpróbálhatjuk tovább erőltetni a lock alapú megoldást, de egyre biztosabban érezzük, hogy ez ide nem a megfelelő technika.

Megoldás

A tényleges megoldáshoz meg kell ismerkednünk sokkal erőteljesebb és profibb technikákkal is. Mivel volt már korábban arról szó, hogy a lock utasítás valójában a Monitor objektumosztály két megfelelő metódusának felel meg, így kutatásunkat folytassuk a Monitor osztály további lehetőségeinek felderítésével!

  • A Monitor.Enter függvényt már ismerjük, a lock utasításhoz tartozó programblokk belépési pontját helyettesíti, konkrétan felhelyezi a zárat. Amíg a zár felhelyezése nem megvalósítható, a szálat sleep állapotban tartja.

  • A Monitor.Exit függvényt is ismerjük, a lock utasításhoz tartozó programblokk kilépési pontján fut le, feloldja a korábban elhelyezett zárat.

  • A Monitor.TryEnter függvény igazából az Enter egy gazdagabban paraméterezhető változata. Meg lehet adni egy maximális várakozási időt, ameddig sleep-ben lehet tartani a szálat. Ha ennyi idő alatt nem sikerül a lock-ot felhelyezni, akkor a TryEnter feladja. A sikeres vagy sikertelen lock-felhelyezésről a függvény bool típusú visszatérési értéke tájékoztat.

  • A Monitor.Wait függvény, melyet egy sikeres Monitor.Enter vagy sikeres Monitor.TryEnter után lehet használni. Hatására a szál felengedi a korábban megszerzett zárat (hasonlóan az Exit-hez), de a szál cserébe azonnal sleep üzemmódba tér át. Amíg ő a sleep üzemmódban van, addig a többi szálnak van lehetősége zárat felhelyezni és tevékenykedni. A sleep állapotból a Wait-et használó szál felébredhet, de az ébredés pillanatában a zárat visszakapja, ébredés után tehát megint nála a zár. A zár végleges feloldására továbbra is az Exit használható.

  • A Monitor.Pulse függvény felébreszt maximum egy – a Wait-tel álomba küldött – szálat, jelezvén, hogy olyan változás történhetett, amelyre ő várakozik. A lock-ot azonban nem engedi fel, ahhoz meg kell hívni az Exit függvényt is.

  • A Monitor.PulseAll függvény szerepköre teljesen hasonló a Pulse-hoz, de ő nem egy, hanem több szálat is felébreszthet. Akkor használjuk, ha az adott állapotváltozásra több szál is várakozhat.

Számunkra a Wait és a Pulse fogja az új lehetőségeket nyújtani. A Wait szokásos használata során először is megszerezzük a zárat (biztos-ami-biztos alapon), majd megvizsgáljuk, hogy a körülmények valóban megfelelőek-e a tevékenység végrehajtásához. Ha nem, akkor ideiglenesen felengedjük a zárat a Wait segítségével, és várakozunk sleep állapotban. Addig várakozunk, amíg a logikai feltételben leírt változókat valamely más szál módosítja, ezáltal lehetővé teszi azt, hogy befejezhessük a ténylegesen várakozást.

A többi szál igyekszik jófej lenni. Ha módosítanak azokon az értékeken, melyek kulcsfontosságúak a várakozó szál számára, a Pulse vagy PulseAll függvényekkel jelzik ezt. Enélkül a rendszer nem ébresztené fel a Wait-ben alvó szálat, nem feltételezné, hogy eljött az ő ideje. A Pulse használata tehát kulcsfontosságú (lásd az 5.5. forráskód).

5.5. forráskód. Wait és Pulse használata I. – vázlat

                                                                                                                                     

                                                                                                                                     
     
// egyik szál 
Monitor.Enter(sajat); 
while (! <feltétel>) 
{ 
   Monitor.Wait(sajat); 
} 
// tevékenység végrehajtása 
// amely lock-t igényel 
Monitor.Exit(sajat); 
 
// ----------------------------------------- 
 
// másik szál 
Monitor.Enter(sajat); 
// tevékenység végrehajtása 
// amely módosítja a <feltétel> 
// értékét a másik szálon 
Monitor.Pulse(sajat); 
Monitor.Exit(sajat);
    

5.6. forráskód. Wait és Pulse használata II. – vázlat

 
// egyik szál 
lock(sajat) 
{ 
 while (! <feltétel>) 
 { 
   Monitor.Wait(sajat); 
 } 
 // tevékenység végrehajtása 
 // amely lock-t igényel 
} 
 
// ----------------------------------------- 
 
// másik szál 
lock(sajat) 
{ 
 // tevékenység végrehajtása 
 // amely módosítja a <feltétel> 
 // értékét a másik szálon 
 Monitor.Pulse(sajat); 
}

A fenti programtervezési minta alapján a termelő-fogyasztó problémakör már megoldható jó minőségben, biztosítva a hibamentességet, valamint a busy-waiting-et is elkerülve (lásd az 5.7. forráskód).

5.7. forráskód. Termelő-fogyasztó megoldás

 
   class Gyujto 
   { 
      static List<double> lista = new List<double>(); 
      const int maxMeret = 50; 
 
      public static double kivesz() 
      { 
         double x; 
         lock (lista) 
         { 
            // varakozas mig lesz elem 
            while (lista.Count == 0) 
               Monitor.Wait(lista); 
            // van elem 
            x = lista[0]; 
            lista.RemoveAt(0); 
            // ures helyre varakozok ebresztese 
            Monitor.PulseAll(lista); 
         } 
         return x; 
      } 
 
      public static void berak(double x) 
      { 
         lock (lista) 
         { 
            // varakozas amig lesz ures hely 
            while (lista.Count >= maxMeret) 
               Monitor.Wait(lista); 
            // van ures hely 
            lista.Add(x); 
            // ures helyre varakozok ebresztese 
            Monitor.PulseAll(lista); 
         } 
      } 
   }

Befejezési probléma

Van még egy fontos kérdés, melyet tárgyalni érdemes: honnan tudják a fogyasztók, hogy a termelők már nem fognak újabb értékeket előállítani?

A kérdés persze fordítva is megfogalmazható: honnan tudják a termelők, hogy a fogyasztóknak nincs szükségük újabb értékekre? Ez a pull-push[10] probléma.

Egy ilyen termelő-fogyasztó rendszer lehet pull működésű. Erre az a jellemző, hogy a termelők kezdik a folyamatot, elkezdenek értékeket előállítani, és minden értéket megpróbálnak belerakni a gyűjtőbe. A termelést azonban a fogyasztók szabályozzák oly módon, hogy amikor már nincs több értékre szükségük, akkor egyszerűen nem vesznek ki további elemeket a gyűjtőből. A termelők eközben újabb értékeket állítanak elő még mindig – de a gyűjtő időközben megtelt, ezért a termelő szálak sorban leállnak, sleep állapotban várják a hely felszabadulását.

Ezen felépítésben a fogyasztóknak egymással is meg kell állapodni, hogy nem akarnak már tovább fogyasztani, és a termelő szálaknak fel kell tudni ismerni, hogy a gyűjtőbe rakni már nem érdemes, mert a fogyasztók onnan nem fognak már elemet kivenni.

A push működés esetén a termelők szabályozzák az előállítást. Amennyiben már nincs több előállítandó elem, akkor leállnak. Eközben a fogyasztók újra és újra beállnak a gyűjtő sorába, várakozván, hogy elem kerüljön be, amit feldolgozhatnak, de a gyűjtőbe már soha nem fog új elem érkezni.

Ezen működés esetén a termelők általában sorra állnak le, egymással különösebb egyeztetés nélkül, míg az utolsó termelő szál is le nem áll. Az időközben sleep-ben várakozó fogyasztóknak ezt fel kell tudni ismerni, és le kell állnia.

Hogyan kezeljük ezeket a szituációkat?

Leállítás adminisztrálása

Kezdjük a termelő szálak leállítási problémájával! A kiindulási alapunk, hogy a fogyasztó szálak sorra állnak le, mivel nincs már szükség újabb értékre. Amíg a fogyasztók mindegyike leáll, a gyűjtő megtelik a szorgos termelők által előállított értékekkel, majd a termelők a következő berak művelet végrehajtása közben a Wait hatására beállnak sleep állapotba.

A fogyasztók valahogyan megegyeznek, hogy amikor az utolsó fogyasztó szál is leáll, akkor meghívnak egy speciális metódust, melyet nevezzünk el mindenLeall műveletnek! Ez a művelet nem feltétlenül a gyűjtő része, de akár a gyűjtő osztályon belül is megvalósítható. A mindenLeall művelet hatására a Wait-ben várakozó termelő szálakat fel kell ébreszteni, és jelezni kell számukra, hogy a termelés folytatása szükségtelen. Ezt a void visszatérésű berak függvény bajosan tudja jelezni, érdemes tehát ezt kivételfeldobás formájában jelezni.

Ehhez a gyűjtőben bevezetünk egy logikai értékű propertyt, amely true értékkel jelzi, ha az összes fogyasztó szál leállt volna. A berak művelet a Wait-ből ébredve ellenőrzi ezt a propertyt, és szükség esetén kivételt dob fel. A property egy privát mező értékét olvassa ki, a működési logika lényege tehát nem a property belsejében van, hanem egyéb tevékenységekbe van elrejtve.

A kulcs egy számláló (_fogyasztoSzalFutDb), melyet minden fogyasztó szál indításakor növelünk 1-gyel. Ehhez készült támogatásképp a fogyasztoSzalIndul() metódus. Ezt a külvilág fogja meghívni a fogyasztó szálak indításakor (reméljük). Szintén a külvilág feladata, hogy a fogyasztó szál leállásakor az ellentételező metódust, a fogyasztoSzalLeall() metódust meghívja. Ez csökkenti a számláló értékét 1-gyel, így elvileg a gyűjtő mindig tudja, hány futó fogyasztó szál van. Ha ez a számláló lecsökken nullára, akkor minden fogyasztó szál leállt (lásd az 5.8. forráskód).

5.8. forráskód. Termelő szálak leállásának kezelése – támogatás

     
class Gyujto 
{ 
   static bool _termelokLealltak = false; 
   static int _termeloSzalFutDb = 0; 
 
   public static void termeloSzalIndul() 
   { 
    lock(typeof(Gyujto)) 
    { 
      _termeloSzalFutDb++; 
    } 
   } 
 
   public static void termeloSzalLeall() 
   { 
    lock(typeof(Gyujto)) 
    { 
      if (_termeloSzalFutDb>0) 
            _termeloSzalFutDb--; 
      if (_termeloSzalFutDb<=0) 
      { 
         _termelokLealltak = true; 
         lock(lista) 
           Monitor.PulseAll(lista); 
      } 
    } 
   } 
 
   public static bool termelokLealltak 
   { 
     get { return _termelokLealltak; } 
   } 
}
    
                                                                                                                                               

                                                                                                                                               
    

Megj.: az 5.8. forráskód termeloSzalIndul metódusában szereplő kód az Interlocked osztály megfelelő metódusával könnyebben megvalósítható. A lock sem kell, egyszerűen Interlocked.Increment(ref _termeloSzalFutDb);.

Hasonló számláló és kezelési támogatás definiálható a termelő szálak számának menedzseléséhez. A kód az 5.9. forráskódban látható. Vegyük észre, hogy a private mezőre szükség van! A program indulásakor ugyanis se termelő, se fogyasztó szál nincs. Tegyük fel, hogy a program először a termelő szálakat indítja, amelyek azonnal termelni is kezdenek! Tegyük fel, hogy az első termelő szál el is készül az első értékkel, és azt elhelyezné a gyűjtőbe, mikor is ránéz, hogy van-e futó fogyasztó szál! Ekkor még azt látja, hogy a fogyasztó szálak száma 0, és azt hinné, hogy nincs már szükség termelőkre.

Ezért a _fogyasztokLealltak értéke induláskor false, a _fogyasztoSzalFutDb értéke induláskor 0. Amíg nem indult el legalább egy fogyasztó szál, addig nem állapíthatjuk meg, hogy a fogyasztó szálak mindegyike leállt már. Ezért van az, hogy a fogyasztokLealltak nem abból állapítja meg, hogy a fogyasztók mindegyike leállt-e, hogy a _fogyasztoSzalFutDb aktuális értéke nulla-e vagy sem.

Amennyiben a szálak számlálója nullára csökkenne, a PulseAll segítségével minden alvó szálat ébresztünk, hogy az ellenkező feladatú[11] szálak leállhassanak.

5.9. forráskód. Fogyasztó szálak leállásának kezelése – támogatás

 
class Gyujto 
{ 
   static bool _fogyasztokLealltak = false; 
   static int _fogyasztoSzalFutDb = 0; 
 
   public static void fogyasztoSzalIndul() 
   { 
    lock(typeof(Gyujto)) 
    { 
      _fogyasztoSzalFutDb++; 
    } 
   } 
 
   public static void fogyasztoSzalLeall() 
   { 
    lock(typeof(Gyujto)) 
    { 
      if (_fogyasztoSzalFutDb>0) 
            _fogyasztoSzalFutDb--; 
      if (_fogyasztoSzalFutDb<=0) 
      { 
         _fogyasztokLealltak = true; 
         lock(lista) 
           Monitor.PulseAll(lista); 
      } 
    } 
   } 
 
   public static bool fogyasztokLealltak 
   { 
     get { return _fogyasztokLealltak; } 
   } 
}

A gyűjtő kódjának kiegészítése

A berak és kivesz metódusokat kiegészítjük a leállás kezelésével. Amennyiben a számlálók elérnék a nullát, a PulseAll ébreszti az esetlegesen Wait-ben várakozó szálakat. Azok felébrednek, ellenőrzik, hogy végleges leállásról van-e szó, mert ha igen, akkor kivételt dobnak, és kilépnek. Ezzel a gyűjtő kódja teljesnek tekinthető.

Figyelem: a fejezetben szereplő az 5.8., 5.9 és az 5.10. forráskódok együtt alkotják a teljes Gyujto objektumosztályt!

5.10. forráskód. A gyűjtő kódjának kiegészítése

                                                                                                                                     

                                                                                                                                     
     
class Gyujto 
{ 
   public static double kivesz() 
   { 
      double x; 
      lock (lista) 
      { 
         // varakozas mig lesz elem 
         while (lista.Count == 0) 
         { 
            Monitor.Wait(lista); 
            if (termelokLealltak) 
              throw new Exception("Leallt␣minden␣termelo"); 
         } 
         // van elem 
         x = lista[0]; 
         lista.RemoveAt(0); 
         // ures helyre varakozok ebresztese 
         Monitor.PulseAll(lista); 
      } 
      return x; 
   } 
 
   public static void berak(double x) 
   { 
      lock (lista) 
      { 
         // varakozas amig lesz ures hely 
         while (lista.Count >= maxMeret) 
         { 
            Monitor.Wait(lista); 
            if (fogyasztokLealltak) 
              throw new Exception("Leallt␣minden␣fogyaszto"); 
         } 
         // van ures hely 
         lista.Add(x); 
         // ures helyre varakozok ebresztese 
         Monitor.PulseAll(lista); 
      } 
   } 
}
    

Komplex feladat

A feladat: fejlesszünk olyan alkalmazást, amely 4 szálon keres prímszámokat; minden szál más-más számintervallumon dolgozzon! Az előállított prímszámokat egy 50 elemet tárolni képes gyűjtő kezelje! Indítsunk 2 feldolgozó szálat, melyek a prímszámokat a képernyőre írják, az egyik feldolgozó szál zölddel, a másik sárgával írjon! A végén jelenítsük meg, hogy melyik feldolgozó szál hány prímet írt ki összesen a képernyőre (az 5.2. ábra)!

5.2. ábra. Komplex feladat képernyőkimenete

Először készítsük el a prímszámkereső szálak függvényeit! A Termelo osztály (az 5.12. forráskód) konstruktora fogadja az adott kereső példány számára kijelölt intervallumot, majd elmenti saját mezőibe. Az elkezd metódus először is regiszrálja magát mint futó termelő szálat a gyűjtőben, és módszeresen elkezdi a kijelölt intervallumbeli számokat tesztelni, prímek-e. A példában a jobb érthetőség kedvéért nem végeztünk optimalizálási lépéseket ez ügyben (a páros számokat igazából kihagyhatnánk stb.), és a megtalált prímeket a gyűjtőbe helyezi a berak segítségével. Az intervallum végére érve a prímek keresése leáll, valamint regisztráljuk, hogy maga a termelő szál is leáll.

A Fogyaszto felépítése hasonló (az 5.13. forráskód). A konstruktora fogadja a kiírás során használt színt, és tárolja saját mezőbe. Az elkezd metódus ismeretlen mennyiségű prímet fog kiírni, mivel egyrészt megjósolhatatlan az adott intervallumba eső prímek száma, másrészt a fogyasztó szálak nem is ismerik a termelő szálak számát, se a számukra kiosztott intervallumok méretét.

A while true ciklus elvileg a végtelenségig futna, de a megoldásunk push típusú, vagyis a termelő szálak önállóan állnak le, a fogyasztó szálaknak kell odafigyelni. A kivesz metódus kivétel dobásával jelzi, hogy minden termelő szál leállt, és nincs és nem is lesz már több elem a gyűjtőben. Ezért a kivesz metódushívást try catch blokkba helyezi. A kivétel felbukkanásakor a feldolgozó ciklusból a break segítségével lépünk ki.

A fogyasztó minden egyes sikeresen kiolvasott és a képernyőre kiírt prímszám esetén egy belső számlálót növel, hogy a végén lekérdezhető legyen az összes darabszám.

A főprogram 4 termelő szálat indít (az 5.11. forráskód), különböző keresési számintervallumot kiosztva részükre. Majd két fogyasztó szálat indít, egyiket sárga (Yellow), másikat zöld (Green) írási szín használatára ösztönözve. A program a továbbiakban megvárja, amíg mindkét fogyasztó szál leáll (Join hívása), amikorra egyébként a termelő szálak is biztosan leállnak. A Main függvény maradék szakasza a két fogyasztó által kiírt prímek darabszámát jelzi ki a feladatban megfogalmazottak szerint. A futás folyamata (két változatban) az 5.1. videón látható.

5.11. forráskód. A komplex feladat megoldása

     
using System; 
using System.Collections.Generic; 
using System.Threading; 
 
namespace ParhProgram 
{ 
   class FoProgram 
   { 
      public static void Main() 
      { 
         Console.SetWindowSize(140, 40); 
         // 4 db termelo szal inditasa 
         for (int i = 0; i < 4; i++) 
         { 
            int k = 10000 * i; 
            int v = 10000 * (i+1)-1; 
            Termelo t = new Termelo(k, v); 
            Thread thr = new Thread(t.elkezd); 
            thr.Start(); 
         } 
         // 2 db fogyaszto szal inditasa 
         Fogyaszto f1 = new Fogyaszto(ConsoleColor.Yellow); 
         Thread thr1 = new Thread(f1.elkezd); 
         thr1.Start(); 
         Fogyaszto f2 = new Fogyaszto(ConsoleColor.Green); 
         Thread thr2 = new Thread(f2.elkezd); 
         thr2.Start(); 
         // 
         thr1.Join(); 
         thr2.Join(); 
         // 
         Console.ForegroundColor = ConsoleColor.Gray; 
         Console.WriteLine("\n"); 
         Console.WriteLine("1.␣fogyaszto:␣{0}␣primet␣irt␣ki", 
                  f1.darabSzam); 
         Console.WriteLine("2.␣fogyaszto:␣{0}␣primet␣irt␣ki", 
                  f2.darabSzam); 
         Console.ReadLine(); 
      } 
   }
    

5.12. forráskód. A komplex feladat megoldása

 
   class Termelo 
   { 
      protected int intervallum_kezd; 
      protected int intervallum_vege; 
 
      public Termelo(int k, int v) 
      { 
         this.intervallum_kezd = k; 
         this.intervallum_vege = v; 
      } 
 
      public void elkezd() 
      { 
         Gyujto.termeloSzalIndul(); 
         for (int i = intervallum_kezd; i <= intervallum_vege; i++) 
         { 
            if (prim_e(i)) 
            { 
                  Gyujto.berak(i); 
            } 
         } 
         Gyujto.termeloSzalLeall(); 
      } 
 
      public bool prim_e(int x) 
      { 
         int gyoke = (int)(Math.Sqrt(x)); 
         for (int i = 2; i <= gyoke; i++) 
         { 
            if (x % i == 0) return false; 
         } 
         return true; 
      } 
 
   }
                                                                                                                                               

                                                                                                                                               
    

5.13. forráskód. A komplex feladat megoldása

 
   class Fogyaszto 
   { 
      protected ConsoleColor szin = ConsoleColor.Black; 
      protected int _darabSzam = 0; 
 
      public Fogyaszto(ConsoleColor szin) 
      { 
         this.szin = szin; 
      } 
 
      public int darabSzam 
      { 
         get 
         { 
            return _darabSzam; 
         } 
      } 
 
      public void elkezd() 
      { 
         this._darabSzam = 0; 
         Gyujto.fogyasztoSzalIndul(); 
         while (true) 
         { 
            try 
            { 
               int x = Gyujto.kivesz(); 
               Console.ForegroundColor = this.szin; 
               Console.Write("{0,5}␣", x); 
               this._darabSzam++; 
            } 
            catch 
            { 
               break; 
            } 
         } 
         Gyujto.fogyasztoSzalLeall(); 
      } 
   }

5.14. forráskód. A komplex feladat megoldása

 
   class Gyujto 
   { 
      static List<int> lista = new List<int>(); 
      const int maxMeret = 50; 
 
      public static int kivesz() 
      { 
         int x; 
         lock (lista) 
         { 
            // varakozas mig lesz elem 
            while (lista.Count == 0) 
            { 
               Monitor.Wait(lista); 
               if (termelokLealltak) 
                  throw new Exception("Leallt␣minden␣termelo"); 
            } 
            // van elem 
            x = lista[0]; 
            lista.RemoveAt(0); 
            // ures helyre varakozok ebresztese 
            Monitor.PulseAll(lista); 
         } 
         return x; 
      } 
 
      public static void berak(int x) 
      { 
         lock (lista) 
         { 
            // varakozas amig lesz ures hely 
            while (lista.Count >= maxMeret) 
            { 
               Monitor.Wait(lista); 
               if (fogyasztokLealltak) 
                  throw new Exception("Leallt␣minden␣fogyaszto"); 
            } 
            // van ures hely 
            lista.Add(x); 
            // ures helyre varakozok ebresztese 
            Monitor.PulseAll(lista); 
         } 
      }

5.15. forráskód. A komplex feladat megoldása

 
 
      static bool _fogyasztokLealltak = false; 
      static int _fogyasztoSzalFutDb = 0; 
 
      public static void fogyasztoSzalIndul() 
      { 
         lock (typeof(Gyujto)) 
         { 
            _fogyasztoSzalFutDb++; 
         } 
      } 
 
      public static void fogyasztoSzalLeall() 
      { 
         lock (typeof(Gyujto)) 
         { 
            if (_fogyasztoSzalFutDb > 0) 
               _fogyasztoSzalFutDb--; 
            if (_fogyasztoSzalFutDb <= 0) 
            { 
               _fogyasztokLealltak = true; 
               lock (lista) 
                  Monitor.PulseAll(lista); 
            } 
         } 
      } 
 
      public static bool fogyasztokLealltak 
      { 
         get { return _fogyasztokLealltak; } 
      } 
 
      static bool _termelokLealltak = false;

5.16. forráskód. A komplex feladat megoldása

 
      static bool _termelokLealltak = false; 
      static int _termeloSzalFutDb = 0; 
 
      public static void termeloSzalIndul() 
      { 
         lock (typeof(Gyujto)) 
         { 
            _termeloSzalFutDb++; 
         } 
      } 
 
      public static void termeloSzalLeall() 
      { 
         lock (typeof(Gyujto)) 
         { 
            if (_termeloSzalFutDb > 0) 
               _termeloSzalFutDb--; 
            if (_termeloSzalFutDb <= 0) 
            { 
               _termelokLealltak = true; 
               lock(lista) 
                  Monitor.PulseAll(lista); 
            } 
         } 
      } 
 
      public static bool termelokLealltak 
      { 
         get { return _termelokLealltak; } 
      } 
 
   } // end of class Gyujto

Szemafórok

A szemafórokat mint alapvető programozási eszközöket Edgser Dijkstra mutatta be 1965-ös cikkében [11]. A szemafór egy vasúti sorompóra emlékeztető szerkezet: ha fel van nyitva, akkor szabad az átjárás, míg lezárt állapotában engedélyezett. Az Init műveleten felül két művelete van mindössze: a P művelet[12] (wait), illetve a V művelet[13]. A szemafórok rendelkeznek egy számlálóval is, melynek értékét az Init 0-ra állítja be, a V művelet növeli, a P művelet csökkenti – amennyiben annak értéke pozitív volt a P művelet kezdésének időpontjában. Ha a P művelet kezdetekor a számláló értéke nem pozitív – a P művelet „megvárja” annak bekövetkeztét (sleep). Mind a P, mind a V művelet végrehajtása atomi művelet.

Az atomi műveleti szabály miatt egymás után (vagy akár „egyidőben” is) több V művelet is futhat, hiszen ezek növelik a számlálót. Ezen számláló értéke azt mutatja, hány P művelet futhat le egymás után (mielőtt újabb V művelet tovább növelné az értéket). Ha a számláló értéke pl. 5, akkor 5 P művelet futhat le, a hatodik már várakozni lesz kénytelen. Eképpen a számláló azt mutatja, hogy a szemafórhoz tartozó erőforrásból mennyi áll rendelkezésre.

Vegyük észre, hogy a korábban bemutatott Monitor, és a lock működése egyezik azzal a speciális szemafór viselkedéssel, amikor a számláló értéke az 1 és 0 között ingadozik. Ezen szemafor kezdeti értéke (Init-ben beállított kezdőérték) 1. A Monitor.Enter() lényegében a P művelet (a számláló csökken nullára, a következő Enter már várakozni lesz kénytelen), míg a Monitor.Exit() nem más mint a V művelet (a számláló visszaáll 1-re, a következő Enter le tud futni). A szemafórok egy nem OOP-s megközelítésű megoldását mutatja be az 5.17. algoritmusrészlet.

5.17. forráskód. Dijkstra szemafór megvalósítás

     
Init(s szemafor, v egész szám) 
{ 
 s <- v; 
} 
 
P(s szemafor) // erőforrás lefoglalása 
{ 
 várj, míg nem igaz, hogy s > 0, 
   akkor s <- s-1; 
 /* ha az s > 0 bekövetkezett, a műveletnek atominak kell lennie*/ 
} 
 
V(s szemafor) // erőforrás felszabadítása 
{ 
 s <- s+1; /* atomi műveletnek kell lennie */ 
}
    

A .NET-ben az első verzióban a szemafórok nem kerültek implementálásra, így a programozók kénytelenek voltak azt saját maguk elkészíteni. Első lépésként készítsük el a szemafór interface-t:

      
interface ISemaphore 
{ 
 void Initialize(int count); 
 void ObtainResource();      // P művelet 
 void ReleaseResource(); // V művelet 
}
     

Második lépésként pedig a Monitor osztály ismert műveleteivel segítségével elkészíteni a szemafórt.

      
class OldSchoolSemaphore : ISemaphore 
{ 
 private object lockObjSem; 
 private int Count; 
 
 public void Initialize(int count) 
 { 
   Count = count; 
   lockObjSem = new object(); 
 } 
 
 public void ObtainResource() 
 { 
   lock (lockObjSem) 
   { 
    while (Count == 0) // várakozás amíg nem lesz pozitív 
    { 
      Monitor.Wait(lockObjSem, Timeout.Infinite); 
    } 
    Count--; 
   } 
 } 
 
 public void ReleaseResource() 
 { 
   lock (lockObjSem) 
   { 
    Count++; 
    Monitor.Pulse(lockObjSem); 
   } 
 } 
}
     
                                                                                                                                               

                                                                                                                                               
    

A .NET 2.0 óta azonban a szemafór osztály eleve része a Frameworknek, így az implementáció belső része egyszerűsíthető.

      
class NewSemaphore : ISemaphore 
{ 
 public void Initialize(int count) 
 { 
   sem = new Semaphore(0, int.MaxValue); 
 } 
 
 public void ObtainResource() 
 { 
   sem.WaitOne(); 
 } 
 
 public void ReleaseResource() 
 { 
   sem.Release(1); 
 } 
 
 private System.Threading.Semaphore sem; 
}
     

Termelő-fogyasztó implementálása szemafórokkal

A termelő-fogyasztót megvalósító generic osztály kódja a szemafórokkal az alábbi módon készíthető el:

      
class WaiterQueue<T> 
{ 
 private Queue<T> _Q; // a lista 
 private ISemaphore _sem; // a segítő szemafor 
 private object _lockObj; // csak hogy legyen mit lock-olni 
 
 public WaiterQueue(ISemaphore semaphore) 
 { 
   _lockObj = new object(); 
   _Q = new Queue<T>(); 
   _sem = semaphore; 
   _sem.Initialize(0); 
 } 
 
 public void Put(T obj) 
 { 
   lock (_lockObj) 
   { 
    _Q.Enqueue(obj); // új elem érkezett 
    _sem.ReleaseResource(); // lehet kivenni 
   } 
 } 
 
 public T Get() 
 { 
   _sem.ObtainResource(); // várj amíg lehet kivenni 
   lock (_lockObj) 
   { 
    return _Q.Dequeue(); // vegyük ki 
   } 
 } 
}
     

Az ebben a fejezetben szereplő szemafór megvalósítás, és a generic gyűjtő osztály kódja a szerző, Pócza Krisztián engedélyével, az ő ELTE IK-n .NET Framework és Programozása tárgy oktatási anyagából származik [12].

Összefoglalás

Az eddigi fejezetek tárgyalták mindazokat az ismereteket, melyek szükségesek a párhuzamos programozás alapszintű problémáinak kezeléséhez.

A párhuzamos programozás során szálakat indítunk. A szálak egymással úgy tudnak kommunikálni, hogy olyan osztályszintű vagy példányszintű mezőkbe helyeznek el, melyeket a szálak kódjai közösen tudnak használni. Az osztályszintű mezőknél ez általában problémamentes, a példányszintű mezők esetén ügyeljünk arra, hogy a szálak tényleg ugyanazon példány mezőit használják!

A szálak ezen közös változók használata során zárakat (lock) helyeznek fel, hogy biztosítsák a változók írásának egyediségét, védett kódrészleteket alakíthassanak ki. Zárak kialakításánál egy referencia típusú változóra (mezőre) kell hivatkozni. Szintén fontos arra ügyelni, hogy minden szál használjon zárat, és ugyanarra a referenciára hivatkozzon a zár felhelyezése során. A zárat a minimálisan szükséges ideig tartsuk fenn, mivel más szálak várakozni kénytelenek, ha ők is ugyanezt a zárat kívánják felhelyezni ez idő alatt!

Egyszerű zárakat a lock utasítással lehet készíteni. Bonyolultabb esetben a Monitor osztály metódusait lehet használni. A Wait és Pulse segítségével lehet a bonyolultabb problémákat, mint például a termelő-fogyasztó problémát kezelni.

A bonyolultabb zárolási szituációk kapcsán két problémát kell ismernünk, ez pedig a holtpont (deadlock) és a kiéheztetés (starving). Az első elkerüléséért a programozó a felelős, a másodikért az operációs rendszer. A holtpont akkor alakulhat ki, ha két szál két zárat kíván egymásba ágyazva felhelyezni, de eltérő sorrendben próbálkozik.



[10] pull: húzni, push: tolni

[11] a termelő szálak elfogyása esetén a fogyasztó szálak stb.

[12] „proberen”, kipróbál

[13] „verhogen”, növel

6. fejezet - A párhuzamos és elosztott működés

A számítógépes programok egyfajta egyszerűsített modellje szerint a feladat nem más, mint adatfeldolgozás. Ezen modell szerint a program tevékenysége egy -leképezés, mely a bemenő adatértékek sorozatát egy értéksorozatra képezi le (). A program tervezőjének feladata a leképezés matematikai megtervezése, a programozó feladata a terv kódolása, a leképezés tulajdonságainak megőrzése mellett.

A leképezés megadása tulajdonképpen az elvárt működés megadása a végeredményre koncentráltan. Vagyis azt adjuk meg, hogy mely bemenő adatok esetén mely kimenő adatok előállítását várjuk el a programtól. Ennek során a feldolgozás módját ritkán határozzuk meg.

A számítógépes feldolgozás hagyományosan lineáris működésű. A feldolgozást elemi lépésekre kell bontani, melyek adott sorrendben végrehajtva a kívánt végeredményt számolják ki. A kezdeti időkben a számítógépek egyetlen processzort tartalmaztak, melyek egy időben egyetlen utasítást voltak képesek végrehajtani, ezért a programozók a kódoláskor arra koncentráltak, hogy az utasítások megfelelő sorrendiségével biztosítsák a kívánt végeredményt.

Az idő haladtával azonban újabb architektúrák jöttek létre. Az ugyanazon eszközbe épített több processzor (vagy processzormag) esetén lehetőség nyílik párhuzamos adatfeldolgozásra is. Több, fizikailag különálló gép hálózatba kapcsolásával szintén a párhuzamos feldolgozáshoz hasonló, de több fontos jellemzőjében különböző elosztott feldolgozás is megvalósítható.

A különböző környezetekben más-más problémákkal kell megküzdeni. Tekintsük az egyszerű egyprocesszoros számítógépeket kiindulási alapnak! Ebben az architektúrában egy időben egy program fut, mely a memóriában tárolt adatokhoz versenyhelyzet nélkül képes hozzáférni, azokon módosításokat elvégezni.

A többprocesszoros rendszerek esetén, mint láthattuk, a legnagyobb probléma a memória-hozzáférés szabályozása, elsősorban a memóriába írásokkal kapcsolatosan. A lock, a Monitor, a védett blokkok kialakítása nyújthatja a megoldást. Ugyanakkor láthattuk, hogy ez kettős fegyver, a deadlock kapcsán akár hibákat is idézhet elő.

Elosztott környezetben a programok ugyan időben párhuzamosan futnak, de mindegyikük más-más eszközön, melyek fizikailag különböző memóriával rendelkeznek. Emiatt nem kell foglalkozni a programrészek atomicitásának problémájával, mivel egyik program sem „zavarja” a másik működését. Itt mások a problémák.

A fizikailag különböző számítógépek dolgozhatnak ugyanazon számításon, de jellemző, hogy a részeredményeiket megosztják egymással. Ezt üzenetküldéssel érhetik el. Az üzenet továbbítása időbe kerül (küldés, fogadás, hálózati késleltetés), amelyet kommunikációs költségnek nevezünk. Cél hogy minimalizáljuk a kommunikációs költséget, azaz optimalizáljuk az üzenetek számát valamint méretét.

Osztályozás

A párhuzamos vagy elosztott algoritmusokat csoportosíthatjuk a közöttük futás közben felfedezhető kapcsolatok alapján:

  • Szinkronizált: az algoritmusok valamilyen módon képesek egymás számára jelezni, hogy épp melyik munkafázisban vannak, és a következő munkafázisba lépésük feltétele egymás megfelelő állapota.

  • Aszinkron: a processzek egymástól teljesen függetlenül működnek, jellemzően mindössze működésük végén kommunikálnak egyszer, akkor is elég gyakran csak a vezérlő processzel, egymással nem. Bár az aszinkron működés nem feltétlenül jelenti a kommunikáció hiányát, inkább a processzek egymástól független működését jelöli. Aszinkron működés mellett gyakori az aszinkron üzenetküldés is, mikor az egyik processz ugyan küld üzenetet a másik processznek az aktuális állapotáról vagy a számított részeredményről, de nem győződik meg az üzenet fogadásáról, folytatja a működését az üzenet elpostázása után.

  • Hibrid működés: a processzek működésük során a szinkron és aszinkron kommunikáció sajátosságait is tartalmazzák, az egyes munkafázisokat más-más kommunikációs modell szerint oldják meg.

Vegyük észre, hogy a szinkron és aszinkron működés nem kötődik a párhuzamos vagy elosztott felépítéshez! A különbség mindössze az, hogy a párhuzamos architektúra esetén a szinkronizálást a processzek közös memóriájának kihasználásával valósítjuk meg, az elosztott működés esetén pedig üzenetek küldésével. A hasonlóság miatt a párhuzamos (vagy elosztott) programoknál is szükségszerű belátni a holtpontmentességet és a kiéheztetésmentességet.

Adatcsatorna

Példa: az Igazgató Úr rendelkezésére a cég humán erőforrás osztályának meg kell adni azon dolgozók neveinek listáját, akik legalább 50 évesek, legalább 10 éve megszakítás nélkül a cég alkalmazottjai, és eddig nem kaptak jubilemumi jutalmat.

A feldolgozást gyorsítandó egy láncot alakítunk ki a humán erőforrás osztály dolgozóiból. Az első láncszem elkezdi felolvasni a neveket és személyi számokat ABC sorrendben haladva a Nagy Dolgozónyilvántartó Kapcsos Könyvből. A második dolgozó minden személyi szám hallatán gyorsan (fejben) kiszámolja van-e már legalább 50 éves az illető. Ha nincs, akkor a nevet nem adja tovább. Ha ő megvan 50 éves, akkor a nevet továbbadja. A harmadik dolgozó a Lefűzött Bérkifizetési Jegyzékek könyvben ellenőrzi a megkapott neveket, hogy minden egyes hónapban kapott-e havi juttatást az elmúlt 10 évben. Ha kapott, akkor a nevet továbbadja. A negyedik dolgozó a Megrendelések Szürke Könyvében ellenőrzi hogy rendeltek-e ilyen névre valaha Jubileumi Emlékplakett-et a beszállítóktól. Ha igen, akkor a nevet felírja egy Kockás Lap-ra. A humán erőforrás osztály vezetője a Kockás Lap-t a végén átviszi az Igazgató Úrnak, aki elégedetten bólogat és mosolyog, majd kávéval és teasüteménnyel kínálja a sok munkában bizonyára elfáradt Osztályvezető Asszonyt [14].

A számítógépes programunkat modellező függvény gyakran felbontható valamely , , , függvények kompozíciójára:

Ekkor a feldolgozás párhuzamosítható oly módon, hogy az egyes processzeket maguk az függvények alkotják (a 6.1. ábra).

6.1. ábra. Függvénykompozíció

Az adatcsatorna módszer segítségével a feldolgozás párhuzamosítható, de alkalmas elosztott kiértékelés előállítására is. Az adatok a kezdő adatgenerátor pontról indulva áthaladnak az egyes függvényeket alkalmazó pontokon, végül elérvén a teljes feldolgozás állapotát a záró (begyűjtő) pontra érkeznek. Természetesen az optimális működéshez elengedhetetlen, hogy az egyes feldolgozó pontokból az adatok folyamatosan áramoljanak ki, ne kelljen minden egyes bemenő adat feldolgozására várakozni az első output megjelenéséig.

Az egyes processzek közötti szinkronizációról a processzek közötti adatáramlás gondoskodik. Természetesen nehéz úgy felbontani az eredeti függvényt kompozícióra, hogy az egyes függvények kiértékelésének sebessége egyforma legyen. A kiértékelés tényleges sebessége a leglassúbb függvényen múlik. Ezen pont előtt az adatok fel fognak torlódni, a mögötte elhelyezkedő feldolgozó elemek pedig folyamatos várakozásban lesznek. Az ilyen elemet bottleneck-nek (torlódásos pont, szűkület, szűk keresztmetszet) nevezzük.

Ugyanakkor nemcsak statikus sebességeltérésekre lehet számítani, hanem dinamikus sebességingadozásokra is. Az egyes feldolgozási csomópontok eltérő jellegű adatelemekre eltérő feldolgozási sebességet használhatnak, amit érdemes valamilyen szinten ellensúlyozni. Ezért a feldolgozó csomópontokat nem adatelem szinten szoktuk összekapcsolni, hanem egy méretű FIFO feldolgozású csatornával (a 6.2. ábra).

6.2. ábra. FIFO kapcsolóelem

Az mérete az adott probléma, és a hálózat bizonyos jellemzői mellett állapítható meg. Az elemű puffer az általa összekötött és függvények különböző feldolgozási sebességét egyenlíti ki. A csatornába az függvény írja be az elemeket, figyelvén arra, hogy a csatorna ne legyen teljesen tele. Amikor a csatorna megtelt, az függvény felfüggeszti a saját működését, várakozván legalább egy üres helyre.

Hasonlóan, a csatornát az függvény csak olvassa. Amennyiben az ő működése gyorsabb, mint az függvényé, azt fogja tapasztalni, hogy a csatorna üres. Ekkor az függvény felfüggeszti a saját működését, amíg a csatornába feldolgozható adatelem nem kerül.

Amennyiben az és függvények közel egyforma sebességgel működnek, a csatorna sosem ürül ki, és sosem telik be. Ekkor a a feldolgozás sebessége közöttük optimális.

Elágazás

A 6.2. szakaszban szereplő példához hasonló esetben Igazgató Úr most arra kíváncsi, van-e olyan dolgozója, aki elmúlt 10 évben végig a cég dolgozója volt, de egyszer sem volt betegszabadságon, és legalább 2 gyermeke van. A humán erőforrások osztályán azonban erősen vakarják a fejüket, mert ehhez nem csak azt kell megnézni, hogy kapott-e minden hónapban fizetést az illető, hanem hogy a fizetési jegyzéken megjelenő tételek szerint akár egyetlen napra is kapott-e táppénz címszó alatti kifizetést. A fizetési jegyzékek tételes ellenőrzése rendkívül időigényes munka, nem érdemes egyetlen dolgozóra bízni a láncban, mivel az ő lassúsága a teljes lánc lassúságát okozza. Az osztályvezető asszony döntése szerint ezt a feladatot párhuzamosan végzi majd 8 beosztott. Az első alkalmazott tehát elkezdi felolvasni a dolgozók neveit, majd a nevet a lánc következő pontján álló 8 beosztott egyike kapja meg. Mindenki más nevet ellenőriz a fizetési jegyzékekben. A 8 beosztott közül ha valaki talál a kívánalmaknak megfelelő dolgozót, úgy a nevet továbbadja. A következő láncszem ellenőrzi hogy a kapott nevű dolgozónak van-e legalább 2 gyermeke. A kívánalmaknak eleget tevő dolgozók listája szintén a Nagy Kockás Lapon kerül véglegesítésre.

Az elágazás (fork) szerkezet segítségével a függvény kompozíciós felbontásában szereplő valamely lassú kiértékelésű függvényét lehet többszörözni. A többszörözés során az függvény által feldolgozandó adatokat elosztjuk az példányok között. Amennyiben példányt készítünk az feldolgozó processzből, úgy ezen bottleneck elem feldolgozási sebességét közel -szeresre lehet növelni.

Ez a megoldás csak bizonyos jellemzők esetén valósítható meg. Az függvény elemenkénti feldolgozható kell, hogy legyen.

Valamely függvényről azt mondjuk, hogy elemenkénti feldolgozható, ha az halmaz bármely teljesen diszjunkt felbontása mellett .

Ez a megfogalmazás azt is jelenti, hogy ha az függvénynek valamely sorozat elemeit kell feldolgozni, akkor ezen sorozatot tetszőlegesen felbonthatjuk részsorozatokra, és ezen részsorozatokat átadva az példányoknak, azok egymással párhuzamosan dolgozva a részsorozatokon kiszámíthatják az eredményeket. Az eredmények összesítése (uniója) után már az eredeti állapot visszaáll, mintha a számítást egyetlen függvény végezte volna el.

6.3. ábra. Elágazás bemenő adatok feldolgozására

Sajnos nem túl gyakoriak azok az algoritmikus részfeladatok, amelyek ilyen tulajdonsággal bírnak. Elég gyakori azonban, hogy az algoritmus kis módosításával ez a jellemző kialakítható.

Eldöntés tétele elágazással

Tételezzük fel, hogy adott az elemek egy nagyméretű, elemű tömbje, és egy tulajdonság! Az eldöntés tétele segítségével meg kell vizsgálnunk, hogy az elemű tömbben létezik-e olyan tömbelem, amely tulajdonsággal bír (igen/nem). Az függvény tehát függvény, ahol a tömb alaptípusa. Az függvény egyesével megvizsgálja a tömb elemeit. Ha valamelyik tömbelem tulajdonsággal bír, úgy a függvény értéke (igaz), ellenkező esetben (hamis).

A feladat elágaztatással úgy fogalmazható meg, hogy minden példány kap egy részsorozatot, az eredeti tömb valamely részét. Például 5 példány esetén mindegyik megkapja az eredeti tömb neki jutó egyötöd részét. Mindegyik függvény nyilatkozik, hogy a saját részében van-e tulajdonsággal bíró elem. Az igen/nem válaszok alapján a végleges válasz kiszámítható. Ha az eredeti tömb bármely részében van tulajdonságú elem, akkor az eredeti kérdésre válasz adható. Ekkor nyilvánvaló, hogy valamelyik példány is választ fog adni. A válaszok összesítése után (legalább egy esete) az eredeti válasz helyreállítható.

6.4. ábra. Eldöntés tétele

Ez is mutatja, hogy előfordulhat, hogy a bemenő adatok szétvágása után a részeredményeket gyakran nem szó szerint unió művelettel kell összegezni, de a problémára illesztett utófeldolgozási lépéssel máris előállítható az ekvivalens működés.

Minimumkeresés elágazással

Hasonlóan az előző feladatban megfogalmazottakhoz, most is legyen egy elemű sorozatunk, és keressük a sorozatban előforduló elemek közül a legkisebb értékét! Párhuzamos feldolgozást igényel a probléma, ha az elemek száma nagyon nagy, vagy az összehasonlítás művelete (két elem közül melyik a kisebb) nagyon időigényes.

A párhuzamos feldolgozás esetén a teljes sorozatot részsorozatokra bontjuk. A minimumkereső függvények mindegyike megkeresi a saját részsorozatának minimumát, melyet mint részeredményt publikál. Az utófeldolgozás során a keletkezett minimumértékek közül kell kiválasztani a tényleges minimumot – de ekkor már csak annyi érték közül kell egyetlen processznek választani, ahány elágazási ággal dolgoztunk. Ha azért választottuk a párhuzamos feldolgozást, mert nagyon nagy volt, akkor az utófeldolgozás plusz időigénye elhanyagolhatóan kicsi. Ha az összehasonlítás művelete volt időigényes, akkor ügyelnünk kell arra is, hogy ne dolgozzunk túl sok elágazással, hiszen ekkor az utófeldolgozónak is sok részeredmény minimumával kell dolgozni.

6.5. ábra. Többlépcsős utófeldolgozás

Ezen is lehet segíteni részleges utófeldolgozásokkal. Több utófeldolgozó fokozat beiktatásával egy-egy utófeldolgozó kevés számú elágazási ág részeredményeit utófeldolgozza, majd az ő (finomított) részeredményeiket is egy végső utófeldolgozó fogja átvenni és a tényleges végeredményt előállítani.

Rendezés párhuzamosan

Nem annyira egyszerűen párhuzamosítható algoritmus az elemek rendezése. Szintén működik a részsorozatra bontás és elágazás technikája, mikor is minden részsorozat rendezését az adott rendezőfüggvény példánya végzi. Csakhogy a rendezések részeredményei szintén sorozatok, rendezett sorozatok, melyek egyszerű uniója általában nem produkál teljesen rendezett végeredményt. Ekkor alkalmazható az összefuttatás tétele, mely alkalmas két (vagy több) rendezett részsorozatból kevés plusz művelet ráfordítása mellett teljesen rendezett sorozatot készíteni, mely tartalmazza mindkét részsorozat minden elemét.

Mint látjuk, itt az utófeldolgozás művelete egészen komoly is lehet. Szintén mérlegelni kell a megvalósítás során, hogy a rendezendő elemek mennyisége indokolta-e a párhuzamosítást, vagy az összehasonlító művelet időigénye. Ez utóbbi esetben figyelembe kell venni, hogy az összefuttatás megvalósítása során szintén sok összehasonlító műveletet kell végrehajtani – vagyis elképzelhető, hogy a párhuzamosítás során az utófeldolgozások ideje már figyelmet érdemlő mértékű, és összesítésben nem sokat nyerünk a párhuzamosítással.

A módszer alapjait már Neumann János is bemutatta 1945-ben, merge sort[15] algoritmusként lett ismert. A módszer szerint egy elemű sorozat rendezett, ha vagy . Amennyiben , úgy két (, elemű) részsorozatra vágjuk az adatokat. A két részsorozatot (rekurzívan) rendezzük ugyanezen algoritmussal, majd az eredményt összefésüljük.

Asszociatív műveletek

Legyen a egy halmazon értelmezett asszociatív művelet. Ez esetben .

Jelöljük -t módon! Ekkor az asszociativitás felírható az alábbi módon is:

Az asszociatív művelet feladata az érték kiszámolása.

A kiszámítást menetekre osztjuk (szinkronizált végrehajtás). Az első menet kezdetén processzünk van, melyek rendre ismerik a sorszámuk szerinti elemet a sorozatból ( processzor ismeri az elem értékét). Minden menet működése két fázisra oszlik. Az első fázisban a processzek az általuk ismert adatelem értékét elküldik egy másik processznek, majd fogadják a nekik küldött értéket. A következő fázisban a náluk szereplő érték és a kapott érték esetén alkalmazzák a műveletet.

Az első menetben:

  • üzenetet küld -nek ().

  • a nem tud kinek üzenetet küldeni, nincs jobb oldali szomszédja,

  • az üzenetküldés végére ismeri és értékét (-re), mivel -t megkapja a bal oldali szomszédjától, pedig eleve ismert a processzben,

  • kiszámítja értékét,

  • pihen a processz, mivel neki nincs bal oldali szomszédja, így nála nincsen csak az érték ( processz csak üzenetet küld, nem végez tényleges számolási műveletet),

  • így minden processzor kiszámítja a értéket (), valamint (a processz outputja a nála lévő érték marad).

6.6. ábra. Az első menet üzenetküldései és outputjai

Az első menetben így:

  • üzenetküldés történik,

  • processz végez tényleges számítási műveletet,

  • részeredmény-sorozat számítódik ki.

A második menet hasonlóan zajlik, csak a processzek nem a közvetlen szomszédjaiknak, hanem a 2-vel távolabbi szomszédoknak küldenek üzenetet (egy processz a processznek ). Az üzenetben az előző menet végén kiszámolt értéket publikálják. A és processzeknek nincs 2-vel jobbra lévő szomszédjuk, így ők nem küldenek üzenetet.

A második menetben tehát:

  • üzenetet küld -nek (),

  • az üzenetküldés végére ismeri és értékét (-re),

  • kiszámítja értékét,

  • a , processzek nem kaptak új információt, ők az outputjukon megismétlik az előző menet értékét,

  • így minden processzor kiszámítja a értéket (), valamint .

6.7. ábra. A második menet üzenetküldései és outputjai

A második menetben így:

  • üzenetküldés történik,

  • processz végez tényleges számítási műveletet,

  • részeredmény-sorozat számítódik ki.

A harmadik menet hasonlóan az előzőekhez kétfázisú. A processzek 4 processznyi távolságra küldik a számítási részeredményeket, majd az előző menet végén náluk keletkezett részeredményre, és a kapott értékre alkalmazzák az asszociatív műveletet.

A harmadik menetben tehát:

  • üzenetet küld -nek (),

  • az üzenetküldés végére ismeri és értékét (-re),

  • kiszámítja értékét,

  • processzek megismétlik az előző menet végén náluk szereplő értéket az outputjukon,

  • így minden processzor kiszámítja a értéket (), valamint .

6.8. ábra. A harmadik menet üzenetküldései és outputjai

A harmadik menetben így:

  • üzenetküldés történik,

  • processz végez számítási műveletet,

  • részeredmény-sorozat számítódik ki.

Általánosan, az . menetben:

  • üzenetküldés történik,

  • processz végez tényleges számítási műveletet.

Ha az eredeti sorozat hossza , akkor könnyű belátni, hogy menet végén a processz rendelkezni fog az értékkel, vagyis a számítás befejeződhet. Vegyük észre, hogy a befejező menetben a processzeknél az eredmények szerepelnek!



[14] aki azt hiszi, ez nem valós életbeli példa, annak elárulom: de!

[15] összefuttatásos rendezés

7. fejezet - Hálózati kommunikáció

A továbbiakban elkezdünk az elosztott programozás alapjaival ismerkedni. Az elosztott környezet abban hasonlít a párhuzamos környezetre, hogy az egyes alfeladatokat más-más szál végzi. Csakhogy a szál-ak itt fizikailag is különböző processzoron és memóriában futnak. Emiatt ezeket nem hívhatjuk már szálaknak: processzeknek nevezzük őket.

Üzenetküldés címzése

Az elsődleges problémánk tehát adott – ha a különböző processzek egymással adatokat kívánnak cserélni, nem használhatják a jól bevált technikát: nem helyezhetik el őket egy közös memóriaterületen. Helyette feltételezzük, hogy a fizikailag különböző gépek valamiféle adatcserére alkalmas módon össze vannak kapcsolva. Ennek legtermészetesebb módja a hálózati összeköttetés. A továbbiakban ezt a módszert feltételezzük.

Az egyes processzek úgy valósítják meg egymással az adatcserét, hogy a hálózaton keresztül üzenetet küldenek egymásnak. Az üzenet itt most nem szó szerint értendő, a programok közötti üzenetváltásnak nincs szöveges, érzelmi tartalma. Az üzenet általában egy a jellegét leíró azonosítóból (ID), és megfelelő adatcsomagból (binárisan kódolt számértékek) áll.

Az üzenetküldéshez az internetes adatforgalomban is használt TCP/IP protokollt fogjuk használni. Ezen protokoll a címzetteket IP-cím alapján azonosítja. Az IP-cím egyfajta egyedi azonosító, egy számnégyes, melyben minden egyes szám egy közötti egész szám. Ennek megfelelően IP-cím például a vagy a .

Létezik egy speciális IP-cím, melyre később nagy szükségünk lesz. A IP-cím neve localhost[16]. A localhost azt a gépet azonosítja, amelyiken a program fut. Tehát ha adott gépen futó program erre az IP-címre küld adatot, akkor saját gépének küldi el az adatcsomagot – jellemzően egy másik programnak.

Az IP-címek régebbi változatát IPv4-nek (4-es verziójú változatnak) nevezzük. Az új szabvány (IPv6, 6. verzió) szerint az IP-címek már 128 bitesek, vagyis 16 olyan közötti számmal írhatóak le, mint amilyet az IPv4 változatban említettünk. Valójában ehelyett 8 darab közötti számmal adjuk meg, melyet hexadecimális számrendszerben szokás leírni (pl.: fe80::58dc:6716:6aa7:df4d

A hétköznapokban ritkán használunk IP-címeket. Az IP-címek a számítógépek szintjén működő azonosítási elemek. Az emberek számára a számokból álló azonosítók nehezen jegyezhetők meg. Helyette ún. DNS neveket használunk. Például a localhost név is egy DNS név, de a www.microsoft.com vagy a www.facebook.com is egy-egy DNS név.

A DNS neveket át kell fordítani IP-címekre. Nem minden „DNS névnek látszó stringhez” tartozik IP-cím[17], és a világon nyilván rengeteg DNS név létezik. Egyetlen számítógép nem ismerheti az összeset. A DNS nevek IP-címre átfordításához a számítógépünk elindít egy névfeloldási folyamatot.

A névfeloldási folyamat során a számítógépünk üzenetet küld a hierarchiában felette álló számítógépnek, lekérvén a DNS névhez tartozó IP-címet[18]. Ha ezen gép sem ismeri a választ, ő is üzenetet küld a felettes gépnek. Ez a folyamat addig folytatódik, míg egy olyan géphez nem érkezünk, amely a DNS név legalább egyik részéért felelősnek érzi magát (pl. a .com vagy .hu végződésért). Ekkor visszafele indul meg a kommunikáció, keresi az előtagért felelős gépet (microsoft.com, facebook.com). A megfelelő számítógép tovább keresi a nevet (www.microsoft.com). Ez addig ismétlődik, míg a teljes névfeloldás be nem következik. Az így előállt IP-cím aztán visszajut a kérést beküldő eredeti számítógéphez.

A DNS-feloldáshoz hálózati kommunikációra van szükség. Ha a név a belső vállalati hálózatunk valamely másik gépéhez tartozik, akkor a névfeloldás során a vállalati legfelső szintű DNS szerverig kell csak eljutni a lekérdezésnek – ő ismeri a választ. Ha a feloldandó név egy távoli internetes géphez tartozik, akkor a névfeloldási folyamatunkhoz internetes kommunikáció is szükséges. Ha a feloldandó név a localhost, ahhoz semmilyen kommunikáció nem szükséges, ezen név a gépünk saját azonosítója, a gépünk maga is ismeri a választ.

Az IP-cím az adatcímzés kulcsfontosságú eleme, de önmagában nem elég az üzenet pontos célba juttatásához. Adott IP-című gépen sok program futhat, nem lehet tudni melyiknek szól az üzenet.

A plusz információt, a program azonosítóját úgy nevezzük, hogy port. A port egy egész szám, mely a intervallumba esik. Minden program választ magának egy port azonosítót, és ezt közli az operációs rendszerrel. Ő ellenőrzi, hogy két különböző program ne választhassa ugyanazt az azonosítót, ha megpróbálnák, akkor a második és további kísérleteket már elutasítja. Nyilván nem könnyű ez a feladat, mivel az operációs rendszernek azt is követnie kell, ha egy program lemond erről az azonosítóról, vagy egyszerűen leáll.

Az üzenet küldésekor tehát nemcsak az IP-címet, hanem a portot is meg kell adni. Ez utóbbi nehéz kérdés, mivel egy idegen számítógépen futó programról kell tudni, hogy milyen azonosító számot választott magának. Ebben nagyon sok segítségre nem lehet számítani sajnos, néhány egyszerű segítségen kívül.

A legegyszerűbb módszer, hogy a közös feladaton dolgozó programok választanak egy közös portszámot, és mindnyájan ugyanazt használják. Javasolt az 1024 alatti azonosítók kerülése, mivel azok általában közismert szolgáltatásokat azonosítanak (pl. idő lekérdezése, webszerver, pingszerver stb.). Még így is több mint 60000 különböző azonosító marad a közönséges felhasználói programoknak. Ennyi különböző program biztosan nem fut egy gépen, tehát jó eséllyel találunk szabad azonosítót. Persze egy program több azonosítót is választhat magának, de nem jellemző az 5-nél, 10-nél több port felhasználása.

A másik módszer a port scanning. Ez azt jelenti, hogy a kapcsolat kiépítése során a kezdeményező program a célszámítógép IP-címe alapján módszeresen minden portjára elküldi a csomagot. A legtöbb csomag egyszerűen megsemmisül, ha olyan portra küldjük, amelyhez egyáltalán nem tartozik a túloldalon program. Néhány csomag félremegy, idegen programok kapják meg, ami remélhetőleg nem okoz a működésükben zavart (bár ebben igazából csak reménykedni lehet). A célba jutott csomagra azonban a keresett program megfelelő válaszüzenetet küld, így felismerhető, hogy melyik portot választotta.

A portszkennelés azonban sajnos a behatolók (hackerek, crackerek, vírusok, trójai programok) ismert módszere a célba vett számítógép első felmérésére. Ezért a gépekre telepített tűzfal ezt a tevékenységet általában képes felismerni és félreérteni. Mivel támadásnak minősíti, letiltja a szkennelést végző számítógép felőli üzenetek fogadását, így mire a megfelelő porthoz érnénk, addigra már az nem fog célba jutni.

A harmadik módszer, hogy választunk egy kitüntetett gépet, amelynek az IP-címét minden program ismeri. Ezen a kitüntetett gépen egy speciális programot futtatunk, melynek esetében az általa választott portot is ismeri minden programunk. A saját programjaink indulásuk után választanak egy portcímet maguknak, majd ezen központi programnak a gépünk IP-címét és a választott portunk azonosítóját elküldjük (regisztráció). A többiek IP-címét és portját ezen regisztrációs listából, adatbázisból le tudjuk kérdezni.

A programok le tudják kérdezni annak a gépnek az IP-címét, amelyen futnak. A kérdést nyilván a saját operációs rendszerének kell címezni, amely birtokában van ezen IP-címnek. Vegyük azonban figyelembe, hogy a legtöbb esetben a gépeknek nem egyetlen IP-címe van! Először is mindjárt van a localhost cím (127.0.0.1) és a külvilág számára szóló (külső) IP-cím. Amennyiben a gépnek több hálózati csatolója is van, akkor több külvilági címmel is rendelkezik. Márpedig a legtöbb számítógépnek több hálózati csatolója van, gondoljunk csak a hagyományos vezetékes csatolón kívüli vezeték nélküli hálózati kártyára! Az IP-cím-lekérdezés eredménye tehát jellemzően nem egyetlen IP-címet eredményez, hanem egy listát, rajta a 127.0.0.1 IP-címmel is.

Amikor az egyes programok portot választanak maguknak, meg kell adniuk azt is, hogy melyik IP-cím esetén választják az adott portot mint azonosítót maguknak. Akár az is előfordulhat, hogy minden IP-címen más-más portot választ a program. Ugyanakkor jegyezzük meg azt is, hogy ha a programunk csak a localhost-on választ magának portot, akkor csak a 127.0.0.1-re érkező üzeneteket tudja fogadni! Márpedig erre az IP-címre csak ugyanezen a számítógépen futó program képes üzenetet küldeni!

A port választását portnyitásnak nevezzük. Amikor egy program portot nyit, jelzi az operációs rendszernek, hogy a továbbiakban az ezen portazonosítóval beérkező hálózati csomagokat fogadni kívánjuk. Ezt a portnyitást az operációs rendszer nemcsak azért utasíthatja el, mert az adott port már foglalt, hanem mert a számítógép belső házirendje (policy) ezt tiltja. A házirendet többek között az esetleg futó tűzfalprogram is ismeri, így a portnyitási kísérletet maga a tűzfal is megtagadhatja. Célszerű a gépet felügyelő rendszergazdával egyeztetni, hogyan hozhatjuk a programunkat összhangba a gép házirendjével.

A tűzfalak általában hajlandóak arra, hogy egy program portnyitási kísérletének észlelésekor egy párbeszédablakot dobjanak fel, melynek segítségével a felhasználó házirendi szabályt hozhat létre, megengedvén a port megnyitását. Nagyon szomorú tény, hogy a program fejlesztése közben ez állandó akadályt képez, hiszen valahányszor újrafordítjuk a programunkat, és indítjuk, a tűzfal a módosult programot ismeretlennek véli, és újra meg újra jelzi a portnyitási igényt. A fejlesztők ezért gyakran kikapcsolják a tűzfalat, hogy ezt az akadályt kiiktassák. Nem kívánjuk ezt a megoldást javasolni, mindössze jelezzük, hogy ez gyakori megoldás. Amennyiben ezt választjuk, a fejlesztés végén ne felejtsük el visszakapcsolni, és arról se feledkezzünk meg, hogy a tűzfal kikapcsolt idejében a gépünk védtelenebb a külvilágból érkező támadásokkal szemben. Célszerűbb a portra vonatkozó kivételt definiálni a tűzfalon, így a fejlesztés végén ha el is feledkezünk a szabály visszavonásáról – még mindig kisebb az ebből eredő veszély.

Újabb egyszerű módszer, hogy a fejlesztés idejére rendszergazdaként jelentkezünk be, vagy a programunkat rendszergazdai jogkörrel futtatjuk. Az ezen jogkörrel futó programokat a tűzfal általában azonnal átengedi, nem kérdőjelezvén meg a portnyitási kérelmet. Óvatosan bánjunk ezzel a lehetőséggel is, hiszen rendszergazdai jogkörrel futó (esetleg hibás) program komoly károkat is képes okozni a gépen tárolt adatokban! A publikus portot nyitó rendszergazdai jogkörrel futó programokat a külső támadások is előszeretettel veszik célba, hiszen nagy lehetőségeket rejt magában: egy ilyen jogkörű programon keresztüli betörés általában a behatoló számára szintén biztosítja a rendszergazdai jogkört.

Mindenképpen fontos, hogy ismerjük meg azokat a problémákat és veszélyeket, melyeket a publikus portnyitás jelent. Egy vállalati belső hálózaton működő (pl. vállalati szerver tartomány, DMZ, hallgatói labor, gépterem) gépek természetesen eleve védettebbek az internet irányából érkező támadásokkal szemben. Ezért egy ilyen környezetben a számítógépek házirendje is sokkal megengedőbb lehet. A programunkat futtató környezetet a fejlesztés előtt ilyen szempontból tanulmányozzuk, és készüljünk fel a lehetséges problémákra!

IP-cím megállapítása

A Microsoft.NET Frameworkben a hálózati kommunikációkat támogató, megvalósító objektumosztályok jellemzően a System.Net, System.Net.Sockets névterekben találhatóak. Ezért az alacsony szintű kommunikáció során ezeket az alábbi névtereket érdemes felhasználni, meghivatkozni a programba:

         
using System.Net; 
using System.Net.Sockets; 
using System.IO; 
using System.Text;
          

A port nyitásához alapvetően egy TcpListener osztálybeli példányt kell elkészíteni. A TCP a felhasznált protokollra utal (TCP/IP), míg a Listener magyarra fordítva annyit tesz: figyelő. Tehát egy olyan objektumpéldányt készítünk, amely a TCP protokollon áramló adatcsomagokat figyeli.

A példány konstruktorában meg kell adni, hogy a számítógép melyik hálózati csatolóján működő adatforgalomra kívánunk figyelni, illetve melyik porton. Sajnálatosan az IP-címet nem egyszerűen egy string segítségével kell megadni, hanem egy IPAddress példány elkészítésével.

Az IPAddress osztálybeli példányok az IP-címeket nem hagyományosan fogják fel. A példány készítésénél nem elég egy IP-címet megadni (pl. legegyszerűbben string alakban), helyette érdemes a DNS névfeloldási mechanizmusra építeni, az IP-címeket lekérni.

A portot mindig valamely saját hálózati csatolónkon nyitjuk meg. Sajnos, amennyiben a saját gépünkre a localhost névvel hivatkozunk, úgy csakis a 127.0.0.1 IP-címet kapjuk válaszul. Más azonosítót kell keresnünk a saját gépünkre, amely általánosabb ennél.

Minden számítógépnek van egy olyan DNS neve, mely a belső hálózati rendszerünkben azonosítja a gépet. Ha a gépünk szélesebb körben ismert (internet), ezt a nevet alaposabb megfontolással kell kiválasztanunk, és regisztrálnunk kell a megfelelő felsőbb szintű szerverekben. Ezt a DNS nevet a programunk szerencsére könnyen le tudja kérdezni, mivel ezt a nevet az operációs rendszerünk biztosan ismeri. Ezt a Dns osztály GetHostName függvénye adja meg.

         
string gepNeve = Dns.GetHostName();
          

Kérjük le az ezen névhez tartozó IP-címeket! Ehhez továbbra is a Dns osztály függvényét kell használnunk, név szerint a GetHostEntry függvényt. A függvény általános feladatú, egy adott DNS névhez tartozó IP-címet (címeket) keresi ki. Adjuk meg neki a saját gépünk nevét, cserébe megkapjuk az összes létező IP-címet, amely a gépünk valamely hálózati csatolójához tartozik. Ne lepődjünk meg, ha ezen felsorolásban nemcsak a hagyományosabb IPv4 címeket, de az újabban egyre szélesebb körben elterjedő IPv6 címeket is megtaláljuk!

      
IPHostEntry cimek = Dns.GetHostEntry(gepNeve); 
foreach (IPAddress ip in cimek.AddressList) 
      Console.WriteLine("IP␣cím:␣[{0}]", ip);
     

7.1. ábra. A listázás kimenete

A portnyitáshoz csakis ezek az IP-címek állnak rendelkezésre, mivel csakis a listában szereplő IP-címek tartoznak ahhoz a számítógéphez, amelyen az alkalmazásunk fut. Ha több hálózati csatolónk is van, nem célszerű közülük random választani, mivel ezek eltérő fizikai adottságokkal is rendelkezhetnek. Pl. ha van egy gyors vezetékes csatolónk, nem érdemes a relatíve lassú WIFI-s csatolónkon portot nyitni (hacsak nem indokolja ezt valami erősen).

A különböző csatolóink különböző IP címtartományba is eshetnek (ez erősen jellemző a bridge funkciókat is ellátó vállalati szerverek esetén). Ez esetben egy kliens gép számára csak az ő számára definiált IP címtartomány, és az ehhez tartozó szerver hálózati csatoló látható. A szerver valamely másik csatolóján nyitott port nem elérhető.

Beállítások beolvasása

A programunk hordozhatósága érdekében javasolt egyfajta beállításokat tartalmazó fájlba írni a választandó IP címet (és a választandó portot is). A beállításokat korábbi hagyományok szerint .ini fájlokban, újabb módszerek szerint .xml fájlokban érdemes tartani.

Az ini fájlok egyszerű text fájlok, melyekben név-érték párosok szerepelnek, melyeket kis csoportokba, szekciókba szervezünk. A szekciók neveit szögletes zárójelek közé szokás tenni.

7.2. ábra. Egy ini fájl a notepad++ szerkesztőben

Az ini fájlok kezeléséhez sajnos a Framework nem tartalmaz kész osztályt (bár az XML alapú konfigurációt akarják standarddá tenni), de kezelésük roppant egyszerű. Az interneten számtalan ini kezelő class tölthető le forráskódban, és a WinAPI tartalmaz natív metódusokat is, melyek használatával ugyan már kikerülünk a .NET védett világából, de elérhetjük a Windows-ban már definiált ini kezelő library függvényeket.

Ha saját megoldást készítünk, tudnunk kell, hogy az ini fájlok valójában sororientált szöveges fájlok, egyszerűen meg kell nyitni őket mint szöveges fájlt, és soronként beolvasni. Ehhez a StreamReader osztályt érdemes használni. A konstruktorban kell megadni az .ini fájl nevét, illetve az .ini fájl kódlapját. Választható többek között az UTF-8 kódolás, illetve a telepített Windows operációs rendszerünk beállított kódlapja (default kódlap). A StreamReader osztály a System.IO névtérben, az Encoding felsorolás viszont a System.Text névtérben található, ezért érdemes ezt a két kódlapot is behúzni a forráskód elején a using segítségével. Ne feledjük, hogy a string literálok belsejében a \ karakter speciális jelentésű! Vagy meg kell duplázni őket a string belsejében ("c:\\temp\\beallitasok.ini"), vagy a string literált a @ jellel kell kezdeni (@"c:\temp\beallitasok.ini").

         
StreamReader r = 
  new StreamReader(@"c:\temp\beallitasok.ini",Encoding.Default);
          

Valójában nem szokás fix alkönyvtárneveket beégetni a programok forráskódjába, ez rontja a hordozhatóságot, nehezebb ekkor más alkönyvtárba telepíteni a kódot. Helyette egyszerűen adjuk meg az ini fájl nevét:

      
StreamReader r = new StreamReader("beallitasok.ini",Encoding.Default);
     

Kérdéses, hogy ez esetben mely alkönyvtárban fogja keresni az operációs rendszer ezt a fájlt. Ez egy fontos kérdés, és sok fejlesztő elnagyolva tudja erre a választ. Képzeljük el azonban azt a szituációt, hogy a programunkhoz készítünk egy indító ikont a windows munkaasztalon (7.3 ábra)! Ott nemcsak az indítandó program nevét, de egy indítás helye alkönyvtárnevet is meg lehet adni. Ez az alkönyvtár lesz a program indítása után alapértelmezett alkönyvtár – a fenti esetben a beallitasok.ini fájlt ebben az alkönyvtárban fogja keresni az operációs rendszer.

7.3. ábra. Programindító ikon beállítása

Természetesen a futtatható program alkönyvtára és az indítás helyét megadó alkönyvtár eltérhet egymástól, mely esetben a programunk nem fogja megtalálni a szóban forgó fájlt. Ezen .ini fájl jellemzően a futtatható programmal egy alkönyvtárban található – így célszerű ezt megadni a megnyitáskor.

Viszont nem tudhatjuk, a programunk melyik alkönyvtárba került feltelepítésre, le kell azt kérdeznünk futás közben a kódból. Ehhez tudnunk kell, hogy a futó programot a .NET úgy tekinti, hogy az egy (vonathoz hasonló) szerelvény[19], melynek elején dübörög az .exe, mint mozdony, és tartozik hozzá néhány .dll fájl is. Ebből a meséből most az assembly volt a kulcsszó, mert erre lesz szükségünk az .exe alkönyvtárának lekérdezéséhez. A szükséges osztály neve Assembly, mely a System.Reflection névtérben található. Számunkra a legfontosabb függvénye a GetExecutingAssembly, mely magáról a futó programról ad vissza sok információt. Ezen információhalmaz része a Location, mely a futó program teljes neve az őt tartalmazó alkönyvtár nevével együtt.

         
string teljesNev = Assembly.GetExecutingAssembly().Location; 
Console.WriteLine("A␣futo␣program␣neve\n␣␣\"{0}\"", teljesNev);
          
                                                                                                                                               

                                                                                                                                               
    

7.4. ábra. A futó program teljes neve

Egy ilyen fájlnévből, mint a futó program teljes neve, egyszerű leválasztani az alkönyvtár nevét. Megkereshetjük a névben előforduló utolsó \ (per) jel pozícióját, és a ing művelettel kivághatjuk azt a stringből. De ennél specifikusabb módszer a Path osztály GetDirectoryName függvényét erre a célra használni. Ennek oka, hogy egyrészt ennek a függvénynek direkt ez a feladata, másrészt egyéb operációs rendszereken (pl. a Linux) az alkönyvtárneveket nem a \ (per) hanem a / (rep) jel választja el egymástól. Ezt a GetDirectoryName függvény tudni fogja, nekünk ezzel nem kell foglalkozni.

         
string teljesNev = Assembly.GetExecutingAssembly().Location; 
Console.WriteLine("A␣futo␣program␣neve\n␣␣\"{0}\"", teljesNev); 
string alkonyvtar = Path.GetDirectoryName(teljesNev); 
Console.WriteLine("A␣futo␣program␣alkonyvtara\n␣␣\"{0}\"", alkonyvtar);
          

7.5. ábra. A futó program alkönyvtára

Ezen alkönyvtárhoz kell a beállításokat tartalmazó .ini fájl nevét hozzáfűzni. Ez is megoldható egyszerű string append művelettel az alábbiak szerint. Vegyük észre, hogy a alkonyvtar változó tartalma szerint nem zárul per jellel, így a hozzá fűzendő fájlnév ezzel a jellel kell, hogy kezdődjön:

         
string iniFileNeve = Path.Combine(alkonyvtar,"beallitasok.ini"); 
Console.WriteLine("A␣beallitas␣file␣neve\n␣␣\"{0}\"", iniFileNeve);
          

7.6. ábra. A beállítás fájl neve

Ennél ravaszabb módszer, ha a beállítás fájl neve megegyezik a futó program, az .exe nevével, csak nem .exe a név vége, hanem .ini. Ekkor sokat egyszerűsödik a beállítás fájl nevének előállítása:

         
string teljesNev = Assembly.GetExecutingAssembly().Location; 
string iniFileNeve = Path.ChangeExtension(teljesNev,".ini");
          

7.7. ábra. A beállítás fájl neve – 2. verzió

Ennek megfelelően a StreamReader-ben hivatkozott .ini fájlnév képzéséhez ezt az utóbbi módszert fogjuk alkalmazni.

         
string teljesNev = Assembly.GetExecutingAssembly().Location; 
string iniFileNeve = Path.ChangeExtension(teljesNev,".ini"); 
StreamReader r = new StreamReader(iniFileNeve,Encoding.Default);
          

A sikeres megnyitás után következhet a beállítások beolvasása a fájlból. Soronként olvassuk a fájl tartalmát, amíg az utolsó sort is be nem olvastuk! Mivel nem tudhatjuk előre, hány sort tartalmaz a beállítás fájl, így ehhez egy while ciklust fogunk alkalmazni. A sikeres fájlnyitás után az r megnyitott fájlhoz tartozik egy EndOfStream logikai tulajdonság, amely true értékű, ha már elértük az olvasás során a fájl végét (az utolsó sort is beolvastuk) – ellenkező esetben false. A fájl egy sorának beolvasását a Console.ReadLine() függvényhez hasonló r.ReadLine() függvény végzi el. A feldolgozás végén a megnyitott fájlt le kell zárni a Close metódussal.

      
while (!r.EndOfStream) 
{ 
 string s = r.ReadLine(); 
 // .. 
 // sor feldolgozása 
 // .. 
} 
r.Close();
     

Az s változó a fájl valamely sorát fogja tartalmazni. Ez lehet szekciónév, lehet egyszerű üres sor, és lehet név-érték páros is. Valamint szokás olyan szabályt bevezetni, hogy ha a sor első karaktere # (hashmark), akkor a szóban forgó sor komment, megjegyzés. Aránylag könnyű eldönteni melyik sor melyik típusba tartozik.

      
string s = r.ReadLine(); 
if (s.StartsWith("#")) /* komment sor */; 
if (s.StartsWith"[")) /* szekcionev */; 
if (s.IndexOf(’=’) > -1) /* név-érték páros */;
     

Jelen esetben a szerver nevű szekció IP-cim és port beállítását kívánjuk kiolvasni. Az alábbi feldolgozó ciklus ki fogja ezt választani. A aktSzekcio változó tartalmazza, hogy melyik szekció tartalmát olvassuk éppen a feldolgozás során. A feldolgozás eredménye, hogy az ipCim és a portSzam változókat kitölti (amennyiben a beállítások fájlban megtalálhatóak ezek az értékek). Ha a feldolgozás során ezekkel a beállításokkal nem találkozna a ciklus, úgy az alapértelmezett String.Empty értékek maradnak a változókban.

      
string ipCim = String.Empty; 
string portSzam = String.Empty; 
// 
string aktSzekcio = String.Empty; 
while (!r.EndOfStream) 
{ 
   string s = r.ReadLine(); 
   // komment sor 
   if (s.StartsWith("#")) 
      continue; 
   // szekcio neve 
   if (s.StartsWith("[")) 
   { 
      int i = s.IndexOf(’]’); 
      aktSzekcio = s.Substring(1,i-1); 
      continue; 
   } 
   // nev-ertek paros 
   int e = s.IndexOf(’=’); 
   if (e > -1) 
   { 
      string nev = s.Substring(0, e); 
      string ertek = s.Substring(e + 1); 
      if (aktSzekcio == "szerver") 
      { 
         switch (nev) 
         { 
            case "IP-cim": 
               ipCim = ertek; 
               break; 
            case "port": 
               portSzam = ertek; 
               break; 
         } 
      } 
   } 
}
     

Konfigurációs XML fájl

A .NET eleve tartalmaz mechanizmust a különféle alkalmazásbeállítások kezelésére. Ezt a modernebb XML alapokon képzeli el. Az alkalmazásbeállításokat tartalmazó XML fájl neve kötelezően App.config (érdekes módon a fájl nevéből hiányzik az .xml kiterjesztés). A telepített alkalmazásban ezen file neve „ProgramNeve.config” lesz, azaz pl. „kereso.exe.config”.

7.8. ábra. Alkalmazás beállítások hozzáadása

Az App.config XML fájl szerkezete szerint külső (gyökér) szinten a configuration elem kell, hogy legyen. Nyissunk ebbe egy appSettings elemet, és ezen XML szekcióba helyezzük el a név-érték párosainkat! Ezt az add taggel tehetjük meg, melynek két attribútuma kell, legyen: a key és a value.

7.9. ábra. App.config xml tartalma

A programunk induláskor automatikusan beolvassa az App.config fájl tartalmát. Ehhez azonban elsőként a System.Configuration nevű assemblyt hozzá kell adni a projekthez (Add Reference menüpont, lásd a 7.10. ábra).

7.10. ábra. System.Configuration assembly hozzáadása

Az App.config tartalmának kezeléséért a ConfigurationManager osztály felelős. Az XML fájlon belüli appSettings szekcióbeli add tagek értékeit az AppSettings property fogja tartalmazni. Kiolvasása nagyon egyszerű:

         
string ipCim = ConfigurationManager.AppSettings["IP-cim"]; 
string portSzam = ConfigurationSettings.AppSettings["portSzam"];
          

Ennél egyszerűbben nem lehet kezelni beállításokat C#-ban. Ugyanakkor jegyezzük meg, hogy az XML fájlok szerkezete bonyolultabb, mint az .ini fájlok szerkezete! S bár szerkeszteni mindkettőt lehet akár az egyszerű jegyzettömb segítségével is, az XML fájlban véletlenül olyan hibát is ejthetünk, amelynek következtében nem csak a rontott sor válik olvashatatlanná, hanem az egész XML fájl is (ha a hiba miatt elveszíti a well-formed tulajdonságát). Valamint az XML fájlok kezelése lassabb, és több memóriát köt le, mint az egyszerűbb .ini fájlos technika.

A teljes portnyitási kód

A fentieknek megfelelően a portnyitás kódja az alábbiak szerint nézhet ki. Feltételezzük az alkalmazás konfigurációs fájl (App.config) használatát! A TcpListener példány konstruktorában nem string alakban kell megadni az IP-címet, hanem egy IPAddress osztálybeli példányt kell átadni. Ilyet a string alakban megadott IP-címből az IPAddress.Parse tud legyártani (4. sor). A második probléma, hogy a portszámot sem string alakban, hanem egész számként kell megadni: ilyet az int.Parse képes előállítani (5. sor). A konstruktor által létrehozott példány még nem kapcsolódott össze az operációs rendszerrel, ahhoz meg kell még hívni a Start metódust is (8. sor). A Start feladata az operációs rendszert értesíteni, hogy a továbbiakban ezen IP-címre és portra érkező adatcsomagokra ez az alkalmazás tart igényt. Kivételkezeléssel állapíthatjuk meg, hogy mindezeket sikerült-e végrehajtani. Ellenkező esetben alkalmazásfüggő a folytatás.

         
TcpListener figyelo = null; 
try 
{ 
  string ipCim = ConfigurationManager.AppSettings["IP-cim"]; 
  string portSzam = ConfigurationSettings.AppSettings["portSzam"]; 
  // 
  IPAddress ip = IPAddress.Parse(ipCim); 
  int port = int.Parse(portSzam); 
  // 
  figyelo = new TcpListener(ip, port); 
  figyelo.Start(); 
} 
catch 
{ 
 figyelo = null; 
 // nem sikerült 
}
          

A kommunikáció megvalósítása

A port sikeres nyitása után várakozni kell bejövő kapcsolatokra. Ez kiszámíthatatlan időpontban fog bekövetkezni, és nem érdemes eközben a processzort terhelni. A bejövő kapcsolatot egy TcpClient példányban fogadjuk és tároljuk el. A figyelő példányunk AcceptTcpClient függvénye pontosan ezt fogja tenni. Az a szál, amelyben ezt a metódust futtatjuk, lemegy sleep állapotba, amíg a nyitott portra másik program meg nem próbál kapcsolódni.

      
 TcpClient bejovo = figyelo.AcceptTcpClient();
     

A továbbiakban a bejovo példányon keresztül tudunk kommunikálni azzal a programmal, amelyik elsőként csatlakozott be a portra. Újabb programok ugyanakkor már nem képesek csatlakozni, mivel a szerver oldalon nem fut az AcceptTcpClient metódus. Ezen problémával később fogunk foglalkozni.

Streamek

A továbbiakban a portot megnyitó, bejövő kommunikációt fogadó programot szerver programnak, rövidebben szerver-nek, a sikeresen becsatlakozott programot kliens programnak, rövidebben kliens-nek nevezzük.

A kommunikációhoz ún. stream-eket kell létrehoznunk. A stream egyfajta egyirányú adatfolyam, melyre adatokat tudunk kiírni. A streamnek mindig két „vége” van. Az egyik végén töltjük be az adatokat, a másik végén azokat ki lehet olvasni. Ennek megfelelően magyarul gyakran folyamnakk fordítják, néha adatfolyamnak, máshol csatornának. Akár a hegyekben dolgozó favágók, akik a kivágott fatörzseket beleeresztik a folyóba, hogy annak egy alacsonyabban fekvő pontján a társaik azokat kihalásszák.

A szerver és a kliens közötti kommunikációhoz két stream kell. Az egyiken a szerver küld adatokat a kliens felé, a másikon a kliens küld adatokat a szerver felé (7.11. ábra).

7.11. ábra. A két program között húzódó streamek

Mindkét oldalon létre kell hozni a megfelelő streameket. A szerver oldalon is kell egy olyan stream, amelyiket a szerver csak olvashatja, valamint egy másikat, melyet csak írhat. Az írásra létrehozott stream esetén meg kell adni egy kódlapot is (ezt érdemes Unicode-ra vagy UTF8-ra választani). Az a program választja meg a kódlapot, amelyik írni fog a streamre. Ugyanezen stream a másik programban a csak olvasható stream lesz, de a kódlapot ott már automatikusan átvesszük. A kódlap egyébként csak szöveges (string) vagy karakteres (char) típusú adatok küldésekor fontos. A bináris adatok esetén érdektelen. Ugyanakkor a nem megfelelő kódlapválasztás később problémákat okozhat.

         
 StreamWriter iro = 
   new StreamWriter(bejovo.GetStream(), Encoding.UTF8); 
 StreamReader olvaso = 
   new StreamReader(bejovo.GetStream());
          

A szerver innentől kezdve készen áll a kommunikációra a vele kapcsolatba lépett, a portra felcsatlakozott kliens programmal.

Egyszerű kommunikáció a streamen keresztül

A szerver az elkészített két streamen keresztül tud adatokat küldeni és fogadni a kliens program felé, ill. felől. A két program valójában ettől a ponttól kezdve egyenértékű. Bármelyik kezdheti a kommunikációt a másik irányába, bármelyik küldhet nagy mennyiségű adatot a másiknak. A szerver és a kliens fogalma mindössze annyiban képez különbséget, hogy a szerver az a program, amelyik a portot megnyitotta, és passzívan várakozott, a kliens az a program, amelyik megtalálta, és csatlakozott rá. A kapcsolat kiépülése és a streamek létrehozása után a kezdeti különbség nem jelent további előnyt vagy hátrányt.

Amennyiben a szerver adatokat, üzenetet kíván a kliens felé küldeni, az iro streamet kell használnia. Adatok küldéséhez a küldésre alkalmas streamre kell az adatokat kiírni. Ehhez az iro példány Write metódusát használjuk. Ez egy többszörösen felüldefiniált metódus, fel van készítve a különböző egyszerű adattípusokra, mint pl. az int, a double, char stb. Szövegek küldésére is alkalmas, de hasonlóan a konzolos write metódushoz, így a szövegek kiírása után a string vége jel nem kerül küldésre. Emiatt a kliens oldalon nem tudják kiolvasni a szöveget, hiszen nem lehet látni még a végét. A szöveg vége jel küldéséhez a WriteLine metódust kell használni.

         
 iro.Write("Hello"); 
 iro.WriteLine("␣World"); 
 int a = 12; 
 iro.WriteLine("x={0}",a); 
 double c = 14.5; 
 iro.Write(c);
          

A stream anatómiája azonban nem ilyen egyszerű. A streamre kiírt adatok jelen esetben a TCP protokoll segítségével tudnak eljutni a célhoz. A TCP protokoll egy csomagalapú protokoll, ahol a küldendő byte-sorozatot kiegészítő információkkal ellátva egy maximalizált méretű byte-tömbbe ágyazzák. A maximális méretről nem könnyű nyilatkozni, de pontos nagysága számunkra nem érdekes jelenleg. Legyen ez most 1300 byte! Vessük össze ezt a fenti kódban foglaltakkal!

7.12. ábra. Az Ethernet II keret felépítése

Az első utasítás a Hello szöveget írja ki a streamre, 5 karakter, ez mondjuk 10 byte. A következő WriteLine 6 értékes karaktert, és egy string vége jelet ír ki, mondjuk 14 byte. Vajon ez azonnal átmegy a hálózaton a célállomáshoz? Nem! A hálózati adatforgalom optimalizálása miatt a küldéshez a szerver oldalon összevárnak 1300 byte-nyi küldendő adatot egy küldő pufferben. Ha azt meghaladó mennyiség gyűlik össze, akkor automatikus a küldés. Amíg azonban a kritikus byte-mennyiség nem gyűlik össze, addig csak a pufferbe kerülnek be a Write és WriteLine által „kiírt” adatok.

Ez gond lehet. Tegyük fel, hogy a kommunikáció úgy kezdődik, hogy a szerver elküldi a saját üdvözlő szövegét! Ez egyes publikus szolgáltatások esetén szokás, és az üdvözlő szöveg általában a szerver neve, verziója, és egyéb, ezen szerverre jellemző fontos információt tartalmaz. Például egy smtp szerver esetén ez lehet a „220 smtp.example.com ESMTP Postfix” üzenet. De ezen üzenet hossza sem elégséges az azonnali küldéshez. A kliens pedig erre várakozik, enélkül nem tudja, kivel kommunikál, mire számítson.

Hogyan tudjuk a küldést azonnal végrehajtani, kikényszeríteni? A stream tartalmaz egy Flush metódust, melynek pontosan ez a célja. A flush hatására a küldő pufferben várakozó (kevés) adat azonnal ténylegesen átballag egy TCP-csomagba ágyazva a túloldalra. Másképpen fogalmazva: az adatok tartózkodási helyéről csakis a flush alkalmazása után állíthatunk biztosat. Érdemes tehát a flush-t alkalmazni a kommunikációs fázisok végén.

A Write és WriteLine hívások tehát gyorsak, mivel a kiírt adatok jellemzően nem kerülnek elküldésre, csak a pufferbe. A Read és ReadLine hívások a fogadó oldalon sokkal érdekesebben működnek. Amíg nincs elég bejövő adat az input pufferben, addig egyik sem tud érdembeli adatokkal visszatérni. Ez (hasonlóan a konzolos ReadLine metódushoz) tetszőleges ideig is eltarthat.

Ha a túloldal megszakítja a kapcsolatot, akkor azt a közöttük feszülő stream azonnal érzékeli, és a Read vagy ReadLine kivételdobással tér vissza. Amíg az input pufferbe az adatok be nem érkeznek, addig a Read metódus sleephez hasonló vagy tényleges sleep állapotban tartja a szálat, kevés erőforrást lekötve. Ha a Read be tud fejeződni, akkor azonnal visszatér, és megadja a kért adatokat. A maradék adatok az input pufferben várakoznak majd, amíg a következő Readek ki nem olvassák.

Értelemszerűen azonban az adatokat csak ugyanabban a sorrendben lehet kiolvasni, ahogy azt a küldő fél elküldte (soros feldolgozás). Ezért különösen fontos, hogy mindkét oldal ismerje az üzenet felépítését, a benne lévő adatok típusát és sorrendjét.

Protokoll

A kommunikáció kapcsán érdemes kidolgozni egy protokollt. A protokoll szabályok halmaza, mely leírja, hogy az egyes üzenetek törzsei milyen felépítésűek, illetve az egyes üzenetek mikor, milyen feltételek mellett bukkanhatnak fel (mikor lehet rájuk számítani). A protokoll tartalmazza azt az egyszerű szabályt is, hogy ki kezdi az első üzenet küldésével. Ez általában a szerver. Az első üzenet felépítését is már a protokoll tartalmazza.

A kliens

A kliens oldalon a szerverhez hasonlóan kell felépíteni a programot, értelemszerűen a portnyitási kódrész nélkül. Emiatt a TcpListener objektumokra nincs szükség. A kapcsolódáshoz a TcpClient-et kell használni. A kapcsolódás végrehajtásához igazából nincs szükség a Start()-hoz hasonló metódus hívásához, a példányosítás során azonnal megpróbál kapcsolódni az adott IP-címen futó számítógép adott portjához. Ha sikerült, akkor a következő lépés a streamek létrehozása. E pillanattól kezdve a kliens is készen áll a kommunikációra.

         
TcpClient csatl = null; 
StreamReader r = null; 
StreamWriter w = null; 
try 
{ 
  string ipCim = ConfigurationManager.AppSettings["IP-cim"]; 
  string portSzam = ConfigurationSettings.AppSettings["portSzam"]; 
  // 
  IPAddress ip = IPAddress.Parse(ipCim); 
  int port = int.Parse(portSzam); 
  // 
  csatl = new TcpClient(ip, port); 
  r = new StreamReader(csatl.GetStream()); 
  w = new StreamWriter(csatl.GetStream(), Encoding.Default); 
} 
catch 
{ 
 csatl = null; 
 // nem sikerült 
}
         
                                                                                                                                               

                                                                                                                                               
    

A kommunikáció

Tételezzük fel, hogy a szerver egy egyszerű számológép funkcióit képes ellátni, képes számokat összeadni, szorozni! Az utasításokat stringek formájában közöljük, a műveletekhez szükséges számértékeket is csatoljuk. Az egyes utasításokat és paramétereiket egymástól függőleges vonallal választjuk el. A protokoll szerint a szerver kezdi a kommunikációt, azonosítva saját magát. A kliens, amennyiben nem kíván újabb feladatokat küldeni, a BYE beküldésével jelzi ezt. Ezután újabb üzenetek forgalmazására már nem kerül sor.

A szerver kommunikációja a portnyitás és a streamek felépítése után az alábbi módon nézhet ki. Első lépésben azonosítja magát, majd várakozik a bejövő üzenetekre. Háromfajta üzenet jöhet:

  • „OSSZEAD|X|Y”: az x és y számok összeadását kérjük,

  • „OSZTAS|X|Y”: az x és y számok hányadosát kérjük,

  • „BYE”: befejezzük a kommunikációt.

      
iro.WriteLine("SZAMOLOGEP␣SZERVER|v1.0"); 
iro.Flush(); 
bool vege = false; 
while (!vege) 
{ 
string feladat = olvaso.ReadLine(); 
string[] ss = feladat.Split(’|’); 
switch (ss[0]) 
{ 
   case "OSSZEAD": 
      { 
        int a = int.Parse(ss[1]); 
        int b = int.Parse(ss[2]); 
        int c = a + b; 
        iro.WriteLine("EREDMENY|{0}", c); 
        iro.Flush(); 
      } 
      break; 
   case "OSZTAS": 
      { 
        int a = int.Parse(ss[1]); 
        int b = int.Parse(ss[2]); 
        if (b==0) 
        { 
         iro.WriteLine("ERR|101|nullaval␣osztas"); 
        } 
        else 
        { 
         int c = a * b; 
         iro.WriteLine("EREDMENY|{0}", c); 
        } 
        iro.Flush(); 
 
      } 
      break; 
   case "BYE": 
      vege = true; 
      break; 
 } 
}
     

A kliens oldalról az első lépés a bejövő stream olvasása, ahol a szerver üdvözlőszövege van. Ha az nem megfelelő, akkor bontjuk a kapcsolatot (BYE üzenet nélkül, mivel nem lehetünk abban sem biztosak, hogy az ismeretlen szerver megértené). A két számolási kérésünkre „EREDMÉNY|X” formátumú választ várunk, amelyben a művelet eredménye az X-ben lesz. Hiba esetén „HIBA|K|str” formátumú választ kapunk, ahol K-ban a hiba kódja, str-ben a hiba szöveges megfogalmazása lesz.

      
string udvozles = r.ReadLine(); 
if (udvozles.StartsWith("SZAMOLOGEP␣SZERVER")) 
{ 
   w.WriteLine("OSSZEAD|12|14"); 
   w.Flush(); 
   string m = r.ReadLine(); 
   string[] ss = m.Split(’|’); 
   if (ss[0] == "ERR") 
      Console.WriteLine("Hiba,␣kod={0},␣{1}", ss[1], ss[2]); 
   else 
   { 
      int c = int.Parse(ss[1]); 
      Console.WriteLine("12+14={0}", c); 
   } 
   w.WriteLine("BYE"); 
   w.Flush(); 
}
     

Többszálú szerver

A szerver megvalósításának egyik legfontosabb problémája, hogyan oldjuk azt meg, hogy a szerver több klienssel is képes legyen kommunikálni egy időben. Feltételezhetjük, hogy a kliensek a kapcsolódás után nem folyamatosan és állandóan terhelik a szervert feladatokkal. Emiatt a szerver bár egy időben több klienssel is fenntartja a folyamatos kapcsolatot, hol az egyiktől, hol a másiktól kap erőforrást terhelő feladatot.

A problémát, amely a legnagyobb akadályt jelenti, éppen az AcceptTcpClient működése okozza. Az első bejövő kapcsolat után létrehozhatjuk a kommunikációs streameket, de ha ugyanazon szálban újra elindítjuk az AcceptTcpClient metódust, akkor a szál újra lemegy sleep állapotba, és nemhogy újabb kliensekkel, de a meglévővel sem fogunk tudni kommunikálni.

Helyette azt kell tennünk, hogy amint bejövő klienskapcsolódást észlelünk, azonnal új szálat nyitunk, melynek átadjuk a szükséges információkat, majd visszaállunk a bejövő kapcsolatok fogadásának állapotába. A külön szálon elindult kommunikáció továbbra is egyetlen klienssel foglalkozik, ezért a felépítése lényegében egyezik a 7.2.5. alszakaszban feltüntetett kóddal.

         
while(true) 
{ 
 TcpClient bejovo = figyelo.AcceptTcpClient(); 
 KliensKomm k = new KliensKomm( bejovo ); 
 Thread t = new Thread(k.kommIndit); 
 t.Start(); 
}
          

Feltételezhetjük, a KliensKomm osztályunk konstruktora TcpClient példányt vár paraméterként. Kiváló lehetőség, hogy elkészítsük a két streamet.

      
class KliensKomm 
{ 
 protected StreamReader iro; 
 protected StreamWriter olvaso; 
 // 
 public KliensKomm( TcpClient bejovo ) 
 { 
   iro = new StreamWriter(bejovo.GetStream(), Encoding.UTF8); 
   olvaso = new StreamReader(bejovo.GetStream()); 
 } 
 // 
 public void kommIndit() 
 { 
            iro.WriteLine("SZAMOLOGEP␣SZERVER|v1.0"); 
            iro.Flush(); 
            bool vege = false; 
            while (!vege) 
            { 
            string feladat = olvaso.ReadLine(); 
            ... 
       } 
 } 
}
     

Többszálú szerver problémái

Két probléma is felmerül azonban, mellyel foglalkoznunk kell. Mindkettő a szerver leállításával kapcsolatos. Amikor a szervernek le kell állnia, akkor:

  • a szerver egy végtelen while(true) ciklusban fut, melyet nem tudunk megszakítani,

  • a becsatlakozó kliensekkel kapcsolatosan futó kommunikációs függvényeket is le kell tudni állítani.

Az első probléma nem egyszerű. A while true ciklust futtató szál az idő nagy részében sleep állapotban van, várakozik a bejövő kapcsolatokra. Emiatt kevés értelme lenne a true feltételt valamiféle logikai változóra cserélni, s ennek értékét egy külső szálban false-ra változtatni. Ugyanis ha nem jön bejövő kapcsolat, akkor a ciklus sem fogja ezt detektálni, és nem fog leállni. Helyette drasztikusabb eszközökhöz kell nyúlnunk. A szerver ezen kódját, amelyben a while true-ban fut a bejövő kapcsolatok kezelése, külön szálba kell tenni, és ezen szálat a Abort() metódussal egyszerűen le kell állítani.

Ennek során a szálak indítása, a szálszerkezet a 7.13. ábrán látható felépítést fogja tükrözni.

7.13. ábra. A szerver program szálfelépítése

A fő szálban érdemes a portnyitást intézni, külön szálon indítani a bejövő kapcsolatok kezelését, majd abortálni azt, és bezárni a portokat.

         
static TcpListener figyelo = null; 
static Thread kapcsolatok = null; 
//       .............................................................        
static void Main() 
{ 
   string ipCim = ConfigurationManager.AppSettings["IP-cim"]; 
   string portSzam = ConfigurationSettings.AppSettings["portSzam"]; 
   IPAddress ip = IPAddress.Parse(ipCim); 
   int port = int.Parse(portSzam); 
   // 
   figyelo = new TcpListener(ip, port); 
   // 
   kapcsolatok = new Thread(kapcsolatFogad); 
   kapcsolatok.Start(); 
   // 
   Console.ReadLine(); 
   // 
   kapcsolatok.Abort(); 
   figyelo.Stop(); 
} 
//       .............................................................        
static void kapcsolatFogad() 
{ 
   while (true) 
   { 
      TcpClient bejovo = figyelo.AcceptTcpClient(); 
      KliensKomm k = new KliensKomm(bejovo); 
      Thread t = new Thread(k.kommIndit); 
      t.Start(); 
   } 
} 
//       .............................................................       
         

Szerver oldali túlterhelés elleni védekezés

Jelen példa és feldolgozása nem térhet ki minden, a témában felmerülő problémára és kezelésére részletesen. De a szerverek, a szerver alkalmazások elleni támadások elleni védekezésről nem lehet eleget beszélni. Vegyük észre, hogy a fenti megoldás nagyon bizalmi alapú. Nagyon egyszerű olyan kliens alkalmazást készíteni, amely egy ciklus segítségével folyamatosan konnektál a szerverre, emiatt a szerverben szálindításokat generál. A sok szál pedig „kifekteti” a szervert, az egyes szálakra kevés processzoridő jut, így a teljes szerver alkalmazás megbénulhat. Ez ellen védekezni kell. Több megoldás közül is választhatunk. Dönthetünk a szálak számának maximalizálása mellett, hagyatkozhatunk a .NET ThreadPool megoldására, vagy az operációs rendszereken tanult valamely más stratégiát is implementálhatjuk – rugalmasan reagálva a gép erőforrásainak terhelhetőségéhez. Egyet nem tehetünk csak meg: semmilyen módon nem foglalkozunk a problémával!

A kliens kommunikációs szálak kezelése

A második probléma érdekesebb. A kapcsolatFogad függvényt egy statikus kapcsolatok mezőben tároljuk, így az Abort ráküldése könnyen megoldható. Ám a kapcsolatFogad függvény által indított szálakat is abortálni kell. Ezeket (egyelőre) nem tároljuk sehol. Érdemes azonban ezeket a szálakat is tárolni. Ehhez hozzunk létre egy szálakat tároló listát, és tegyük bele ezeket a szálleíró objektumokat! Később ismertetett problémák miatt a listát erre az időre a lock segítségével sajátítsuk ki:

         
static List<Thread> futo_szalak = new List<Thread>(); 
// 
static void kapcsolatFogad() 
{ 
   while (true) 
   { 
      TcpClient bejovo = figyelo.AcceptTcpClient(); 
      KliensKomm k = new KliensKomm(bejovo); 
      Thread t = new Thread(k.kommIndit); 
      lock(futo_szalak) 
      { 
       futo_szalak.Add(t); 
      } 
      t.Start(); 
   } 
}
          

Kihasználva a C# 4.0 újdonságait, nagyon könnyű eltárolni ugyanezen listába nemcsak a szálat, hanem a KliensKomm példányt is. Ekkor a listába egy elempárt (touple) kell elhelyezni:

      
static List<Tuple<KliensKomm,Thread>> futo_szalak = 
     new List<Tuple<KliensKomm,Thread>>(); 
// 
static void kapcsolatFogad() 
{ 
   while (true) 
   { 
      TcpClient bejovo = figyelo.AcceptTcpClient(); 
      KliensKomm k = new KliensKomm(bejovo); 
      Thread t = new Thread(k.kommIndit); 
      lock(futo_szalak) 
      { 
       futo_szalak.Add( new Tuple<KliensKomm,Thread>(k,t) ); 
      } 
      t.Start(); 
   } 
}
     

Amennyiben ez utóbbit alkalmazzuk a kódunkban, a főprogramban, a fő szálban könnyű a klienssel kommunikáló mellékszálakat kilőni. Egyelőre nem tárgyaltuk azt a problémát, hogy a futó szálak listáján valóban „futó” szálak vannak-e. Ezért az Abort hívását try ... catch belsejébe helyezzük. A teljes foreach ciklust szintén lockkal védjük le.

      
lock(futo_szalak) 
{ 
      foreach(Tuple<KliensKomm, Thread> p in futo_szalak) 
      { 
       try 
       { 
          p.item2.Abort(); 
       } 
       catch {} 
      } 
}
     

A kliens szálak racionalizálása

Nem túl optimális egyelőre az induló kliens kommunikációs szálak elhelyezése a listában. Ez a lista egyelőre csak duzzad a végtelenségig, onnan egyelőre semmi sem vesz ki elemet. Kinek és mikor kellene onnan kivenni elemet? Célszerűnek tűnik a kliens kommunikáció végén, a „BYE” üzenettel vagy egyéb módon véget érő kommunikáció végén törölni a megszűnő, leálló szálat a listáról. A listát szintén lock-kal kell kisajátítani, ugyanis a törlés alatt egy bejövő kapcsolat érkezhet, amely egy másik szálon elemhozzáadást jelentene, mely két művelet nem futhat párhuzamosan!

A KliensKomm osztály kommIndit metódusának végére célszerű illeszteni a törlés kódját. A metódus korábbi részét érdemes try ... catch blokkba zárni, hogy a kommunikáció során esetleg keletkező kivétel ne akadályozza meg a törlés műveletét. Ügyeljünk azonban arra, hogy a főprogram a szerver befejezésekor abortot küld be ebbe a szálba, amely ThreadAbortException-t okoz! Ez esetben nem kell a törlési lépéseket (és a lockot) elkezdeni, hiszen úgyis a teljes szerver leállása következik.

         
class KliensKomm 
{ 
 public void kommIndit() 
 { 
   bool torles_kell = true; 
   try 
   { 
     ... 
     while (!vege) 
     { 
      string feladat = olvaso.ReadLine(); 
      ... 
         } 
        } 
        catch (Exception e) 
        { 
         if (e is ThreadAbortException) 
            torles_kell=false; 
        } 
        // torles 
        if (torles_kell) 
        { 
         lock(FoProgram.futo_szalak) 
         { 
         Thread ez = Thread.CurrentThread; 
           int i = FoProgram.futo_szalak.IndexOf(ez); 
           if (i!=-1) FoProgram.futo_szalak.RemoveAt(i); 
         } 
       } 
 } 
}
          

Ha a listában Tuple-kat tárolunk, a törlés ott is megoldható, csak nyilván az i index kikeresése másképpen kell, hogy működjön.

Olvasási timeout kezelése

A kliens oldalon azért nem tárgyaljuk részletesen a szálkezeléssel kapcsolatos problémák kezelését, mert egy kliens egy időben csak egy szerverrel szokott kommunikálni. Illetve a kommunikációja lineáris, elküld egy kérést, és megvárja a szerver válaszát. Ezért ezen az oldalon különösebb probléma nem szokott jelentkezni.

Egy probléma mégis akad. Igaz, ez a probléma a szerver oldalon is jelentkezhet, ha úgy adódik. Ez pedig az olvasó stream és a timeout problémája. Ugyanis nincs különösebben egyszerű mód arra, hogy időtúllépést (timeout) programozzunk a beolvasásra. Jelen megoldásunkban ha elindítunk egy r.ReadLine() hívást, akkor várakozni fogunk egy sornyi szöveg beolvasására (akár konzolos esetben).

Ez a szerver esetén nem túl szerencsés, mert mi történik, ha egy kliens bekapcsolódik a nyitott portra, majd egyszerűen nem csinál semmit, nem küld be feladatot? Ha ezt többször is megteszik a szerverrel, akkor a túl sok elindított szál miatt elfogyhatnak a szerverek erőforrásai, a szerver működése lelassul, ellehetetlenül.

A kliens oldalon az a félelem, hogy a szervernek elindított feladatra a kliens csak valamennyi ideig hajlandó várni. Ennek egyik lehetséges oka, hogy a kliens a felhasználóval áll kapcsolatban, a felhasználó pedig türelmetlen típus. Kattintgat, ügyködik, aztán ha nem jön válasz a szervertől, akkor már más feladatot akar kiadni. A kliens sem ragadhat be órákra egy ReadLine hívásba.

Igényként merülhet fel tehát mindkét oldalról, hogy ne ragadjunk be a kommunikáció során egy olvasási fázisba. Nagyon jó lenne, hogy a ReadLine kapcsán megadhassunk egy maximális várakozási időt, de sajnos erre nincs lehetőség. Kerülő utat kell választanunk.

Az alábbiakban bemutatott ReaderFromStream osztály ReadLine metódusának két paramétere van. Az első azt a streamet azonosítja, ahonnan olvasnunk kell, a második paraméter a maximális várakozási idő, amit az olvasásra fordíthatunk. A sikertelen olvasást a null visszatérési érték fogja jelezni.

Ennek során külön szálat indítunk el a tényleges olvasáshoz, majd a Join metódus segítségével várakozunk annak befejezésére. Jó hír, hogy a Joinnak van timeout kezeléssel kapcsolatos paramétere. Amennyiben az adott várakozási idő alatt az olvasás véget ér, a Join azonnal befejeződik, true visszatérési értékkel. Ekkor a példányszintű line mezőbe bekerült, beolvasott értékkel térhetünk vissza. Ha az elindított szál nem áll le az adott idő alatt (vagyis nem fejeződik be a streamről olvasás), akkor a Join false értékkel tér vissza. Ekkor az olvasási szálat termináljuk, majd null értéket adunk meg olvasott adatként.

         
class ReaderFromStream 
{ 
   protected StreamReader r; 
   protected string line = null; 
   // 
   protected void DoRead() 
   { 
      line = r.ReadLine(); 
   } 
   // 
   public string ReadLine(StreamReader r, int timeoutMSec) 
   { 
      this.r = r; 
      this.line = null; 
      Thread t = new Thread(DoRead); 
      t.Start(); 
      if (t.Join(timeoutMSec)==false) 
      { 
       t.Abort(); 
       return null; 
      } 
      return line; 
   } 
}
          

Az itt bemutatott megoldást mind a kliens, mind a szerver oldalon használhatjuk. Igazán kár, hogy a frameworkbeli ReadLine nem tartalmazza ezt az opciót.

Bináris Stream

A korábban bemutatott StreamReader és StreamWriter igazából string alapú kommunikációt jelent. Elsősorban a ReadLine és WriteLine metódusokkal tudunk adatokat fogadni és küldeni. Ez azt is jelenti, hogy minden adatot (számok) szöveges formára kell alakítani a küldéshez, a fogadás során pedig azokat vissza kell alakítani bináris formájukra. A korábban bemutatott mintában is felbukkan ez a megoldás, hiszen az összeadás során küldött adatokat a WriteLine által készített stringbe beillesztettük, a fogadó oldalon pedig az int.Parse segítségével visszaalakítottuk int típusúvá.

Minden string alakra hozás, parse művelet plusz processzoridőt köt le, lassítja a működést. Nagy mennyiségű adatok forgalmazásakor ez már jelentős idő, érdemes más megoldást keresni.

Egy másik stream párost kell ilyenkor alkalmazni. A BinaryWriter és BinaryReader osztályok példányai alapvetően ugyanúgy működnek, mint az eddig bemutatottak. A különbség abban rejlik, hogy ezek a streamek az adatokat lényeges átalakítás nélkül, a memóriában megadott byte-sorozat formájában (bináris alakban) továbbítják, illetve a fogadó oldalon is a beolvasott byte-sorozatot különösebb feldolgozás nélkül, közvetlenül tehetjük a memóriába. Emiatt nagy mennyiségű adatok küldése- és fogadása esetén a járulékos sebesség növelhető.

A BinaryWriter példány esetén a kódlap ugyanúgy megadható, mint a StreamWriter esetén. Az igazi különbségek tehát nem a példányosításnál, hanem a használatnál kerülnek majd elő.

                                                                                                                                     

                                                                                                                                     
         
 BinaryReader r = new BinaryReader( bejovo.GetStream() ); 
 BinaryWriter w = new BinaryWriter(bejovo.GetStream(), Encoding.UTF8);
          

Az író streamre a többszörösen túltöltött (overloaded) Write metódussal írunk. A Write 18 különböző paramétertípust tud kezelni, mindegyiket a maga bináris formájában írja ki. Ebben benne van a 8 egész típus, a 2 lebegőpontos, a logikai, karakter, string és néhány vektor típus is. A kiírással tehát nincs gond.

      
 int i = 13;      w.Write(i); 
 double d = 14.15; w.Write(d); 
 char c = ’A’;           w.Write(c);
     

Az adat olvasását a bejövő stream számtalan ReadXXX metódusa végzi, ahol XXX helyébe az adott típus nevét kell helyettesíteni: az r.ReadBoolean() például egyetlen logikai érték beolvasását végzi el. A fenti 3 kiírás során kiírt adatokat az alábbi módon lehet beolvasni:

      
 int i = r.ReadInt32(); 
 double d = r.ReadDouble(); 
 char c = r.ReadChar();
     

A továbbiakban minden, a korábbiakban említett probléma és lehetséges megoldása itt is fennáll. Az író streamre itt is alkalmazni kell a Flush-t, az olvasáshoz a timeout kezelése alapvetően itt sincs megoldva, de külön szálon indított olvasással kezelhető.

Összefoglalás

Az eddig megismert technikák, a szálkezelés (indítás, leállítás, állapot ellenőrzése), a védett blokkok kialakítása (lock, monitor osztály metódusai), az alacsony szintű stream alapú kommunikáció során igazából minden olyan eszközzel megismerkedtünk, amellyel az elosztott programozás alapszintű problémáit kezelni tudjuk. Mint láthattuk, képesek lehetünk olyan szerver alkalmazások fejlesztésére, amely egy időben több kliens programmal is képes kommunikálni, adatokat, feladatokat cserélni, időtúllépést (timeout) kezelni.

Ezen eszközök alkalmazása az elosztott programok fejlesztésére azonban olyan, mintha a programozók assemblyben fejlesztenének. A lehetőségeink szinte korlátlanok, csak programozási tudásunk és türelmünk jelölheti ki az általunk fejlesztett programok korlátait.

Az elkövetkezendőkben továbblépünk. Magasabb absztrakciós szintű módszerekkel fejlesztjük alkalmazásainkat. Azt fogjuk találni, hogy bizonyos dolgokkal így nem kell annyit foglalkoznunk, azokat a rendszer, egyfajta működtető motor szolgáltatni fogja. Jobban tudunk koncentrálni azoknak a programozási feladatoknak a megoldására, amelyek az adott alkalmazás sajátjai. Ugyanakkor minél magasabb szintre merészkedünk, annál kevésbé tudjuk befolyásolni a motor, a háttérbeli automatizmus működését. Ennek kapcsán néha kompromisszumokat is kell kötnünk.

Az előnyök, amiket kapunk, kézzelfoghatóak. Jóval nagyobb fejlesztési sebesség, kevesebb hibalehetőség, könnyebb tesztelhetőség. Kapunk olyan eszközöket is, melyek alkalmazásunk nyitottságát növelik. Szabványos protokollokat fogunk használni a kommunikációk során, melyeket szintén a háttérbeli motor fog nekünk nyújtani, a részletekkel nem kell törődni. Alkalmazásunkhoz más programozók, más programozási nyelven írt programok is képesek lesznek csatlakozni. A világ részben összeszűkül, részben kitárul. Érdemes megismerni ezt a világot.

Az alábbi technikákról lesz még szó:

  • Remoting

  • Web Service

  • Windows Communication Foundation



[16] helyi gép

[17] próbáljuk meg a www.lajoska.org névhez IP címet találni

[18] léteznek más szkenáriók is, de ezek tárgyalása túlmutat ezen jegyzeten

[19] assembly = szerelvény

8. fejezet - .NET Remoting

A 7.2.5. alszakaszban leírt számológép szerver programunk az alacsony szintű kommunikációs módszerek segítségével készült el. Vizsgáljuk meg alaposabban, miről is szól ez a feladat és ez a megoldás!

A kliens oldalról az „OSSZEAD|12|14” szemszögből kommunikációs esetében nézve nem másról van szó, mint hogy a szerver oldalon meghívunk egy „függvényt” (két paraméterrel), amely egy újabb számot állít elő (számol ki), melyet visszaad a hívás helyére. Egy függvényhívást valósítunk meg. A függvény nevét és a paramétereket küldjük át, majd visszakapjuk a kiszámolt értéket.

A távoli (remote) eljáráshívás (procedure call) egy éppen ezzel foglalkozó módszer. Ugyanakkor a C#, .NET világában egyszerű függvényhívások nem léteznek, a függvények mindig valamelyik objektumosztályba vannak becsomagolva, s innentől kezdve a nevük nem „eljárás” vagy „függvény”, hanem metódus. Esetünkben most nem fogjuk folyamatosan hangsúlyozni ezt a különbséget.

Vagyis távoli metódushívást hajtunk végre, ahol a metódus kódja, a törzs az utasításokkal a szerveren foglal helyet, mi pedig a kliens oldalról aktiváljuk, hívjuk meg.

A hasonlóság adja magát. Ha függvényt hívunk, megadjuk a nevét, felsoroljuk és megadjuk a paraméterek értékeit. Van egy lényeges különbség: ha string alakba rakjuk a függvény nevét, a paraméterek értékét, akkor a fordítóprogram nem fogja ellenőrizni, hogy minden rendben van-e. Elírhatjuk a funkció nevét, túl kevés vagy túl sok paramétert küldhetünk át, nem megfelelő paramétertípust alkalmazhatunk, rosszul választhatjuk meg az elválasztó karaktert stb. Mindezek a szintaktikai hiba egyféle megjelenései, de sajnos nincs hozzá fordító támogatásunk. Ezek a hibák csak futás közben fognak jelentkezni.

Újabb problémák is vannak a stringalapú módszerrel. A szerver oldalon keletkező hibák, kivételek a kliens oldalra nem kivételek formájában érkeznek, hanem stringbe csomagolt hibaüzenet, hibakód alakjában, s hatásuk, kezelésük nem automatikus, mint ahogy azt az OOP-ben megszokhattuk. Sosem szerencsés egy megszokott automatizmust másra cserélni.

Az RPC (Remote Procedure Call) során a szerveren elkészítünk néhány függvényt. A függvények nevét, a paraméterlistát rögzítsük egy interfészben, majd készítsünk belőle DLL-t[20]! A DLL azért jó választás, mert a függvények törzsében lévő kódok nélkül ez egy nagyon kis méretű DLL lesz, könnyen és gyorsan le lehet tölteni a kliens oldalon csakúgy, mint a szerver oldalon.

A kliens oldalon a DLL-re azért lesz szükség, hogy a benne szereplő függvényhívások neveit, paramétereit, a visszatérési értékek helyes használatát a forráskódban a fordítóprogram le tudja ellenőrizni. A szerver oldalon azért van szükség az interfészre, mert ezeknek a függvényeknek kell megírni a kódját. Ezt a kapcsolatot a kliens és a szerver között a WCF-ben (Windows Communication Foundation) szerződésnek nevezzük.

         
namespace Szolgaltatas 
{ 
   public interface ISzamologep 
   { 
      int osszead(int a, int b); 
      int osztas(int a, int b); 
   } 
}
          
                                                                                                                                               

                                                                                                                                               
    

Amikor a Visual Studio-val DLL-t szeretnénk írni, akkor projekt típusnak a „Class Library”-t kell választani.

8.1. ábra. A Class Library projekttípus

A rövid kód begépelése után a class library projektet fordítsuk le! A lemezen kapunk egy (esetünkben) Szamologep.dll nevű fájlt. Ezen fájl az interfészt tartalmazza bináris, lefordított állapotban. Készítsük el először a szervert!

A DLL hozzáadása a szerverhez

A szerver első dolga a tényleges funkciók elkészítése. Egy objektumosztályt kell készíteni, mely implementálja a megadott interfészt. Ehhez először is be kell emelni a szerver kódjába a szóban forgó interfészt. Ehhez a lefordított, bináris kódot fogjuk használni (a kliens is ezt fogja tenni).

Nyissunk új projektet a Visual Studióban, legegyszerűbb konzolos típust választanunk, hiszen a szervernek nem kell látványos grafikus felhasználói felület. Első lépésként a Solution Explorer ablakában a References részen válasszuk az Add Reference menüpontot (8.2. ábra)!

8.2. ábra. Add Reference menüpont

A felbukkanó párbeszédablak egyetlen célja a szóban forgó DLL megtalálása, azonosítása. A DLL-t több forrásban is megtalálhatjuk, a forrásokat a párbeszédablak felső sorában látható lapozófülekkel lehet kiválasztani (8.3. ábra).

  • .NET fül: a Framework részeként telepített, rendszer assemblyk listája,

  • COM fül: a Component Object Model interfész standardnak megfelelő Microsoft (és 3rd party), általában natív kódú komponensek listája

  • Projects fül: ha a solution több projektet is tartalmaz, és ezek némelyike Class Library, akkor azok ebbe a listába kerülnek,

  • Browse fül: a számítógép diszkjeinek, alkönyvtárainak tallózása, fájl szintű keresést tesz lehetővé,

  • Recent fül: a legutóbb kiválasztott DLL-ek listája.

8.3. ábra. Add Reference párbeszédablak

Ha egyetlen solutiont használunk az interfész DLL és a szerver kódolásához, akkor legmegfelelőbb a Projects fül használata. Egyébként a Browse ablakban kell a diszken megkeresni a generált bináris formátumú, .dll kiterjesztésű állományt. A fájl kiválasztása, az OK gomb lenyomása után az állomány felkerül a solution listára (8.4. ábra).

8.4. ábra. A DLL sikeres hozzáadása

A References listán a frissen hozzáadott elemre duplán kattintva az Object Browser ablak nyílik meg, melyben a kis lenyíló fülekre kattintva feltárul az assembly tartalma. Láthatóvá válik, hogy tartalmaz egy Szolgaltatas névteret, abban egy ISzamologep interfészt. Az interfész nevére kattintva az abban deklarált metódusok neve, és paraméterezése is lekérdezhető (8.5. ábra). Erre akkor lehet szükség, ha idegen DLL-t töltünk le. A DLL a Framework rendszerben önleíró, tehát tartalmazza lekérdezhetően, visszafejthetően ezeket az információkat. Ez nagyon jól jön, ha külső dokumentáció hiányában kell használatba vennünk egy DLL-t.

8.5. ábra. A DLL tartalmának megtekintése

Az interfész implementálása

A szerver oldalon az interfész kódjának beemelése után készen állunk a metódusok kidolgozására. Egy objektumosztályt kell készítenünk, implementálva a DLL-ben szereplő interfészt. Később ismertetett oknál fogva válasszuk ősként a MarshalByRefObject osztályt! Ezen osztály az System.Runtime.Remoting assemblyben van definiálva, amely azonban nem alapértelmezett része a legtöbb projekttípusnak. Így ezt az assemblyt szintén manuálisan kell hozzáadni a projekt referencialistájához. A módszert korábban már leírtuk. Mivel ez a Framework részeként telepített assembly, így a .NET fülön lévő listában fogjuk megtalálni (8.6. ábra). Ezenfelül hivatkozzuk meg a szerver kódjában a using segítségével a System.Runtime.Remoting névteret is (lásd a 8.1. forráskód)!

8.6. ábra. A System.Runtime.Remoting hozzáadása

8.1. forráskód. A Kalkulátor osztály

     
using System.Runtime.Remoting; 
 
class Kalkulator : MarshalByRefObject, Szolgaltatas.ISzamologep 
{ 
   public int osszead(int a, int b) 
   { 
      return a + b; 
   } 
   public int osztas(int a, int b) 
   { 
      if (b == 0) 
         throw new ArgumentException("A␣B␣paraméter␣nem␣lehet␣nulla"); 
      return a / b; 
   } 
}
    

Mint láthatjuk, a szerverbeli kód megírása során nem alkalmaztunk különösebb párhuzamos vagy elosztott technikát, nyoma sincs streameknek, szálaknak. A lényegre koncentráltunk. Bonyolultabb példáknál majd nem lesz ennyire egyszerű a helyzet, hamarosan a szálak elő fognak kerülni, de a streamekkel kapcsolatos ismereteinket egyelőre félretehetjük.

A szerver portnyitása

Az RPC módszer kapcsán egy motort kapunk, mely automatikusan fogja fogadni a kliens program utasításait, működteti a metódusainkat, a paramétereket fogadja és átadja, a függvényválaszokat visszaadja a kliensnek. Nekünk a motor néhány alkalmazásfüggő részére kell csak koncentrálnunk. A portnyitás ehhez tartozik.

A portnyitás nem a korábban ismertetett módon fog megtörténni, mivel most a motort kell kiszolgálnunk. A TcpChannel objektumosztályt kell példányosítanunk, melyhez legegyszerűbb paraméterezése szerint csak a portot kell megadni. A nyitott csatornát regisztrálni kell a motorhoz, hogy ő is megismerje, és tudomásul vegye, hogy ezt a portot a számára nyitottuk meg. Ehhez a ChannelServices osztály RegisterChannel osztályszintű metódusát kell használnunk. Az első paramétere a csatorna, a második paramétere egy security beállítás, melyet esetünkben false értékre állítunk. A másik lehetőségünk a true érték, mely esetén a rendszer a csatorna adatforgalmát megpróbálja titkosítani és digitális aláírással hitelesíteni. Jelenleg nekünk erre nincs szükségünk.

      
using System.Runtime.Remoting; 
using System.Runtime.Remoting.Channels; 
using System.Runtime.Remoting.Channels.Tcp; 
 
class FoProgram 
{ 
static void Main() 
{ 
  string portSzam = ConfigurationSettings.AppSettings["portSzam"]; 
  TcpChannel chan = new TcpChannel( int.Parse( portSzam ) ); 
  ChannelServices.RegisterChannel( chan, false ); 
} 
}
     

Jegyezzük meg ezen a ponton, hogy a csatornát nem csak a TcpChannel, de a HttpChannel példányból is létrehozhatjuk! Az első esetben az adatforgalom bináris lesz (érthetjük úgy is, hogy BinaryStream-alapú), a második esetben a nyílt HTTP protokollt fogja a rendszer használni. Ez szélesebb körben implementálható (más programozási nyelvek által írt programok is tudnának csatlakozni), de összességében lassúbb működésű. Arra is van lehetőség, hogy mindkét protokoll használatát megengedjük, mindkét típusú osztályból példányosítva (értelemszerűen más-más portra helyezve őket), és mindkettőt regisztrálva.

      
using System.Runtime.Remoting; 
using System.Runtime.Remoting.Channels; 
using System.Runtime.Remoting.Channels.Tcp; 
 
class FoProgram 
{ 
static void Main() 
{ 
  string port_1 = ConfigurationSettings.AppSettings["port_1"]; 
  string port_2 = ConfigurationSettings.AppSettings["port_2"]; 
  TcpChannel chan = new TcpChannel( int.Parse( port_1 ) ); 
  HttpChannel http = new HttpChannel( int.Parse( port_2 )); 
  ChannelServices.RegisterChannel( chan, false ); 
  ChannelServices.RegisterChannel( http, false ); 
} 
}
     
                                                                                                                                               

                                                                                                                                               
    

Singleton, Singlecall

A továbblépés előtt tisztázni kell a majdani működést. A motor a regisztrált csatornákon a kliens felől függvényhívási kérelmeket fogad. A függvények most példányszintű metódusok, tehát a motornak példányt kell készítenie a Kalkulator osztályból, hogy a metódushívási utasításnak eleget tudjon tenni. Befolyásolhatjuk a motor ez irányú működését, de a lehetőségeink korlátozottak.

  • Kérhetjük, hogy a motor minden egyes bejövő metódushívás esetén új példányt készítsen, meghívja ezen példány metódusát, majd a példányt eldobja. Ez esetben a GC[21] fogja a példányt a memóriából végleg eltakarítani. Ezt a módszert SingleCall-nak hívják.

  • Másik lehetőség, hogy a motor egyetlen példányt készít a szerver teljes futási ideje alatt, minden bejövő metódushívási kérelmet ugyanezen példányhoz irányít. Ez olyan szempontból takarékos megoldás, hogy nem terheli a GC-t és a memóriát a friss példányok eldobásával, valamint a bejövő függvényhívást nem lassítja le az, hogy előbb még példányosítani kell. Ezt a módszert Singleton-nak nevezzük.

Nem tűnik jelentősnek a különbség egyelőre. Valójában a következmények is nagyon hasonlóak. Ha belegondolunk, egyik módszer mellett sem biztonságos a példányszintű mezők használata.

Példányszintű mezők

Tételezzük fel az alábbi feladatot! Egy telefontársaság olyan szolgáltatást hoz létre a szerverén, amely egy telefonszám beküldése esetén információkat ad meg a telefonszám tulajdonosáról. Azonban ezen információkhoz csak bejelentkezett, jogosult felhasználók férhetnek hozzá. Be nem jelentkezett, jogosulatlan felhasználók nem kaphatják meg a teljes információhalmazt amely a telefonszámhoz tartozik, mindössze csak annyit, hogy a telefonszám létezik-e a cég adatbázisában vagy sem. Tervezzük meg az interfészt.

      
interface ITelefonInfo 
{ 
   bool bejelentkezes(string user, string jelszo); 
   string info(string telefonszam); 
}
     
                                                                                                                                               

                                                                                                                                               
    

Próbáljuk meg elkészíteni a kódot vázlatosan! Az elsődleges probléma, amelyre koncentrálunk, a bejelentkezés megoldása és tárolása. Feltételezzük, hogy a felhasználói nevek és jelszavak egy külső sql adatbázisban vannak tárolva, egy sql selecttel le tudjuk kérdezni a jogosultsági szintet adott felhasználónév és jelszó esetén. Ha az legalább 5-ös szintű, akkor a felhasználó jogosult részletes információkat kapni telefonszámos lekérdezés esetén – különben csak létezik igen/nem típusú válaszokat kaphat.

Kérdések az alábbiak:

  • hogyan tároljuk el egy bejövő kapcsolathoz, hogy az már sikeresen bejelentkezett, és hogy milyen jogosultsági szintet ért el?

  • hogyan kezeljük, tároljuk le egy időben több felhasználó bejelentkezési állapotát biztonságosan?

El is jutottunk a példányszintű és osztályszintű mezők használhatósági problémájához. Tegyük fel, hogy a bejelentkezés eljárás példányszintű mezőbe helyezné el azt az információt, hogy a kapott felhasználónév és jelszó milyen jogosultsági szinttel párosul!

      
class Telefon:MarshalByRefObject,ITelefonInfo 
{ 
   protected int felhasznaloSzintje = 0; 
   public bool bejelentkezes(string user, string jelszo) 
   { 
    this.felhasznaloSzintje = 
      [ select szint from userek where 
         user=’<user>’ and jelszo=’<jelszo>’ ] 
   } 
   //  .................   
   string info(string telefonszam) 
   { 
    if (this.felhasznaloSzintje>=5) 
      return "<reszletes␣informaciok>"; 
    else 
      return "<igen/nem␣info>"; 
   } 
}
     

Ha a kezelési módszer Singleton, akkor minden bejövő metódushívás ugyanazon példányhoz irányul. Vagyis ha X felhasználó használja a bejelentkezes metódust, akkor letárolódik a példány mezőjében a felhasználói szintje. Ha ezek után egy Y felhasználó meghívja az info metódust, valójában az X felhasználó jogosultsági szintjét használja. Másrészről, ha az X bejelentkezése után egy Z felhasználó is bejelentkezik, akkor az ő felhasználói szintje felülírja X szintjét (ugyanazon példány ugyanazon mezőjébe kerül), így ha a sikeres bejelentkezés után X próbálna lekérni telefonszám-információt, akkor nem a saját jogosultsági szintjén kapná meg azokat, hanem Z jogosultsági szintjén.

Ha a SingleCall modellt használjuk, akkor minden bejövő hívás más-más (vadonatúj) példányhoz irányul. Az X sikeres bejelentkezése eltárolódik ugyan a példányszintű mezőben, de az a példány azonnal eldobódik (GC eltakarítja). Az X információkérése egy új példányhoz fog kerülni, ahol a felhasznaloSzintje mező értéke alapértelmezetten megint 0 lesz, vagyis X mintha be sem jelentkezett volna.

Ha nem példányszintű mezőbe helyezzük el a felhasználói szintjét, akkor sem oldódik meg a probléma.

      
class Telefon:ITelefonInfo 
{ 
   protected static int felhasznaloSzintje = 0; 
   //  .................   
   public bool bejelentkezes(string user, string jelszo) 
   { 
    felhasznaloSzintje = 
      [ select szint from userek where 
         user=’<user>’ and jelszo=’<jelszo>’ ] 
   } 
   //  .................   
   string info(string telefonszam) 
   { 
    if (felhasznaloSzintje>=5) 
      return "<reszletes␣informaciok>"; 
    else 
      return "<igen/nem␣info>"; 
   } 
}
     
                                                                                                                                               

                                                                                                                                               
    

Ekkor mindegy, hogy a singlecall vagy singleton modellt használjuk, mivel az osztályszintű mezők a példányoktól függetlenül léteznek, mindenképpen csak egyetlen osztályszintű mező lesz jelen az alkalmazásunkban. Ekkor minden bejelentkezés felülírja a korábbi bejelentkezések eredményét, a telefonszám-lekérdezések mindig az utolsó bejelentkezett felhasználó jogosultsági szintjét használják.

A bejelentkezési probléma kezelésére még vissza fogunk térni, de előbb gondoljuk végig, miért nincs harmadik hívási modell, amely megfelelőbb lenne számunkra? Miért nincs olyan lehetőség, hogy minden program, amely bejelentkezik, saját objektumpéldányt kap, és saját példányszintű mezőket? Nehéz erre a kérdésre válaszolni. Van azonban egy könnyen végiggondolható probléma. Mi lenne, ha lenne ilyen? A külső program bejelentkezik, a szerver legyártja a csak neki szóló példányt, tárolja a saját memóriájában. De mikor törölheti? Nem tudhatjuk, a külső program meddig akar dolgozni majd ezzel a példánnyal. Egy maximális időpontot tudunk mondani – ha lecsatlakozik a program, megszakítja a kapcsolatot, akkor a példány törölhető. De addig? A szerver memóriája megtelhet olyan példányokkal, amelyekhez nem tud csatolni semmilyen módszert, amellyel ellenőrizni tudná a példány létezésének jogosultságát.

A fenti kérdésekre léteznek válaszok, jó válaszok. Valamiért ez nem került itt kidolgozásra. Léteznek persze kiutak, melyekre röviden ki is fogunk térni.

A szolgáltatás összerendelése

Megismerhettük, hogyan kell portot nyitni (csatornát létrehozni), illetve megismerkedtünk a két metódushívás példány összerendelési módozattal (singleton, singlecall). De nem vagyunk még készen a szerverrel. Hiányzik még egy lépés. A szerver több portot is nyithat, több szolgáltatást is implementálhat (több olyan objektumosztályt is tartalmazhat), melyet az egyes portokon keresztül a külvilág elérhet. Kell tehát egyfajta összerendelés:

  • mely objektumosztályok hívhatóak meg,

  • mely összerendelési módszeren (sinlgeton, singlecall) keresztül.

Ha ugyanazon csatornán keresztül több objektumosztály is publikálásra kerül, melyekben akár egyforma nevű és paraméterezésű metódusok előfordulhatnak, akkor kell egyfajta módszer, amikor a portra becsatlakozó program képes azonosítani, hogy melyik objektumosztály metódusát kívánja majd meghívni.

Ha belegondolunk, ez már a második szintű azonosítás. A port azonosítja a számítógépen belüli programot (a szerver programunkat), a porton belüli azonosítás pedig egy objektumosztályt azonosít a szerveren belül. Az ugyanazon porton (csatornán) publikált objektumosztályokat a hívó program névvel tudja azonosítani. Természetesen nem kötelezően ugyanazzal a típusnévvel, amit a szerver program fejlesztője használt, hanem ezen a ponton szabadon választhatunk tetszőleges azonosítót.

Az objektumosztály + porton belüli azonosító + összerendelés módszerhármast a RemoteConfiguration osztály hangzatos nevű RegisterWellKnownServiceType metódusával végezhetjük el. Paraméterei:

  • igazából az objektumosztály, melyet publikálni szeretnénk, de az objektumosztály neve önmagában csak deklarációs lépésekben használható a C# nyelv szintaktikája szerint, ezért ehelyett a típusleírót szoktuk megadni, melyet a typeof operátorral lehet képezni,

  • a csatornán (porton) belüli választott azonosító (string),

  • a hívás példány összerendelési módszer.

         
RemotingConfiguration.RegisterWellKnownServiceType 
 ( 
   typeof( Telefon ), 
   "PhoneInfo", 
   WellKnownObjectMode.SingleCall 
 );
          

A szerver kódja tehát összesítve az alábbi módon néz ki. A Main függvényt jelenleg egy roppant egyszerű módon, a Console.ReadLine metódushívással zárjuk. Ez lényeges lépés, mivel ez a motor úgy van felkészítve, hogy ha a Main függvény leáll, akkor a szerver szolgáltatás is leáll, megszűnnek a nyitott portok, nem fogadnak további bejövő kapcsolatokat.

      
static void Main() 
{ 
  string port = ConfigurationSettings.AppSettings["port"]; 
  TcpChannel chan = new TcpChannel( int.Parse( port ) ); 
  ChannelServices.RegisterChannel( chan, false ); 
  RemotingConfiguration.RegisterWellKnownServiceType 
   ( 
    typeof( Telefon ), 
    "PhoneInfo", 
    WellKnownObjectMode.SingleCall 
   ); 
   Console.ReadLine(); 
}
     

Többszálúság

Hány klienssel képes a szerver tartani a kapcsolatot? Erről sehova semmit nem írtunk, nem paramétereztünk, nem nyilatkoztunk.

A motor, melyet használunk, automatikusan többszálú, többklienses tudású eszköz. Egy időben képes ugyanazon klienstől több bejövő hívás kezelésére csakúgy, mint több klienssel való kapcsolattartásra. Ez számunkra azt is jelenti, hogy a metódusok, melyeket megírtunk, igenis több szálon is futhatnak. Ezt figyelembe kell venni a metódusok megírásakor, amennyiben ez szükséges.

Mikor szükséges? Ahogy korábban írtuk: amikor a metódusok közös memóriaterülethez nyúlnak. Ez singlecall esetén nem jelenti a példányszintű mezőket, hiszen minden bejövő hívás más-más példányhoz kerül. Ellenben singleton esetén a példányszintű mezőkhöz való hozzáférést is védeni kell a lock segítségével. Ezen felül példánytól függetlenül használhatunk olyan erőforrásokat (más osztályokban, más osztályok segítségével), amelyeket szintén zárolni kell.

A kliens kódja

A kliens kódjának megírásához a 8.1. fejezetben leírtak szerint az interfészt tartalmazó DLL-t adjuk a projekthez hozzá. Igazából ezzel a munka oroszlánrészén már túl is vagyunk.

Az OOP tanulmányainkból tudjuk, hogy interfészből nem lehet példányt készíteni. Mi most mégis meg kell, hogy próbáljuk, mivel az objektumosztály nem áll rendelkezésünkre, az a szerveren fut. Ezért igazi példányt nem tudunk készíteni, csak egy „ál” példányt, melyet szaknyelven proxy példánynak nevezünk.

A proxy példány úgy viselkedik, mintha ő egy igazi, működő példány lenne. Ugyanakkor minden függvényhívás, melyet felé intézünk, a paramétereket, melyeket megkap, továbbítja a hálózaton a szerver felé, és meghívja az ott ténylegesen lekódolt objektumosztály ténylegesen működő metódusát. Megvárja a választ, majd azt úgy adja vissza a kliens hívási helyére, mintha azt ő maga számolta volna ki.

Proxy példányt az Activator osztály getObject metódusával lehet készíteni. Paramétereként meg kell adni az interfészt (esetünkben nem egyszerűen a nevét, hanem a típusleíróját), illetve a szerver elérhetőségét, ahol a ténylegesen működő osztály publikálva lett.

Ez utóbbit egy URL[22] formájában kell megadni. Ez egy string, mely több részből áll. Az első részében jelezni kell, hogy TCP vagy HTTP csatornán keresztül kívánjuk-e elérni a szervert. A második részben azonosítani kell a szerver gépet (IP-cím vagy DNS név), a portot, amelyet a szerver megnyitott, majd a szerver által választott osztályazonosítót.

A GetObject egy univerzális proxy példány készítő. A visszatérési érték a példány referenciája, de a metódus visszatérési típusa Object. Ezért típuskényszeríteni kell.

         
ITelefonInfo p = (ITelefonInfo)Activator.GetObject 
 ( 
   typeof( ITelefonInfo ), 
   "tcp://localhost:8085/PhoneInfo" 
 ); 
if (p==null) Console.WriteLine( "Nem␣Sikerült" );
          

Az elkészített p egy proxy példány, de igazinak látszik. A továbbiakban a fordítóprogram ellenőrizni fogja, hogy valóban csak a két függvényt hívjuk-e meg, megfelelő paraméterezéssel, és minden mást is értelemszerűen.

      
int x = p.osszead( 12, 14 );
     
                                                                                                                                               

                                                                                                                                               
    

Egy pillanatra térjünk vissza a szerver oldali megvalósításhoz. A szerveren az osztály őseként a MarshalByRefObject osztályt kellett választanunk. Nos, ez az alaposztály biztosítja az együttműködést az RPC „motor” és az szerver oldali osztály metódusai között. Lehetővé teszi az objektum elérését az application domain határán kívülre, üzenetváltások segítségével kommunikál a kliens oldali proxy példánnyal.

Egyedi példányok

A 8.5. lapon említettünk egy loginalapú problémát, melyet nem tudtunk megoldani. Elemeztük, hogy a singleton, a singlecall módszerek sem biztosítanak egyedi példányt az egyes becsatlakozó programok részére. Ez pedig fontos lehet. Nézzünk lehetséges megoldási módszereket!

Login-always módszer: ez a „legbutusabb” megoldási technika lesz. Egyszerűen kihagyjuk a felhasználói azonosítási lépést, cserébe minden egyes függvény paraméterezését kiegészítjük a felhasználói névvel és jelszóval. Minden egyes függvény értelemszerűen azzal kezd, hogy ellenőrzi a felhasználói nevet és jelszót, betölti a felhasználói szintet, végrehajtja a feladatát.

Nem kell részletezni, mennyire rossz ez a módszer. Egyetlen előnye, hogy kétségtelenül működik, és gyorsan elképzelhető és megvalósítható. Kényelmetlen minden egyes metódushívást extra paraméterekkel bővíteni, és lassítja a metódushívásokat, ha minden egyes alkalommal az azonosítási lépéssel is terheljük őket. Session-like módszer: beiktatjuk az azonosítási lépést, de a bejelentkezes függvény nem logikai értékkel tér vissza, hanem egy egyedi azonosító kóddal (sorszám). A bejelentkezés során az adatbázisból ellenőrizzük le a szokásos módon a felhasználó szintjét, de az egyszer letöltött információt eltároljuk a szerver memóriájában, mondjuk egy osztályszintű listában. A listabeli azonosítót adjuk vissza a kliens oldalra mint visszatérési értéket. A továbbiakban minden szerver oldali függvényhíváshoz csatolni kell ezt az azonosító kódot, így a függvények adatbázis-lekérdezés nélkül tudják felderíteni a felhasználói szintet.

Nem vagyunk sokkal előrébb. Az egyes függvényeket nem kettő, hanem egy extra paraméterrel kell kiegészíteni. Ráadásul gondoskodnunk kell arról, hogy az egyes egyedi azonosítók ne legyenek egyszerűen kitalálhatóak. Ha ténylegesen listabeli sorszámokat adunk vissza, pl. 14, akkor azonnal sejthető, hogy van 13, 12 stb. azonosító is. A kliensnek nincs más dolga, mint más azonosítót visszaküldeni, hogy az adott felhasználó jogaival működtethesse a különböző függvényeket. Célszerűbbnek tűnik egy GUID-ot[23] generálni, melyhez a Frameworkben támogatás is van. Az egyes GUID-értékekhez tartozhatnak az egyes bejelentkezéshez tartozó adatok. A GUID-indexelésű lista kezeléséhez a Dictionary típust lehet használni, melynél a listaelemek egyedi indexeléséhez használt típust széles körben megválaszthatjuk.

      
class SessionData 
{ 
   public int felhasznaloSzintje; 
} 
 
class Telefon:MarshalByRefObject, ITelefonInfo 
{ 
   static Dictionary<String, SessionData> sessions 
     = new Dictionary<Guid, SessionData>(); 
   //  .................   
   public string bejelentkezes(string user, string jelszo) 
   { 
    string id = Guid.NewGuid().ToString(); 
    int szint = 
      [ select szint from userek where 
         user=’<user>’ and jelszo=’<jelszo>’ ] 
    SessionData p = new SessionData(); 
    p.felhasznaloSzintje = szint; 
    lock(sessions) 
    { 
      sessions.Add(id,p); 
    } 
    return id; 
   } 
   //  .................   
   string info(string id, string telefonszam) 
   { 
    SessionData p; 
    lock(sessions) 
    { 
      p = sessions[ id ]; 
    } 
    if (p.felhasznaloSzintje>=5) 
      return "<reszletes␣informaciok>"; 
    else 
      return "<igen/nem␣info>"; 
   } 
}
     

A megoldás során egy sessions nevű tömböt tartunk karban. Minden egyes bejelentkezés során generálunk egy új azonosítót (ID), mely egy GUID, egyedi azonosító karaktersorozat lesz. A GUID előnye, hogy egy GUID ismeretében nem található ki más GUID értéke. A könnyebb kezelhetőség miatt a GUID jelsorozatot string alakká alakítjuk át. A SessionData egy olyan rekord, melyben az egyes bejelentkezésekhez csatolt kiegészítő információkat tárolhatunk a szerver memóriájában (biztonságos hely). A bejelentkezés a GUID azonosítóval tér vissza a klienshez.

Az információlekérés során a kliens megadja az egyedi azonosítóját, majd a telefonszámot. A szerver oldalon ekkor kikeressük az azonosítóhoz tartozó tárolt adatokat, majd annak megfelelően folytatjuk a tevékenységet.

Azért áldoztunk ennek a módszernek ennyi teret, mert ez a módszer valóban működik. Elsősorban weboldalak használják, ahol egyébként szintén egyfajta távoli eljáráshívást használunk. Amikor a böngészőbe egy weboldal url-jét gépeljük be, a webszerveren lefut egy program (paramétereket is adhatunk át neki), melynek outputját kapjuk meg a böngészőben.

A weboldalak előszeretettel használják az itt bemutatott session módszert. Csak épp a legtöbb dinamikus weboldalakkal kapcsolatos programozási nyelv esetén (ASP.NET, PHP, ...) a session kezelése automatikus.

A megoldás

Mivel azonban a Framework RPC modellje nem kínál automatikus sessionkezelést, mást kell kitalálnunk. A megoldás sokkal egyszerűbb, mint gondolnánk:

  • első lépésként ne egyenesen a belépést használjuk, először igényeljünk a szervertől egy egyedi példányt,

  • ennek során generáljunk le egy egyedi azonosítót (ehhez továbbra is a GUID-ot javasoljuk),

  • regisztráljuk be ezen azonosítóval a motorhoz a Telefon osztályt, singleton kötéssel,

  • adjuk meg a kliensnek az egyedi azonosítót!

A kliens az egyedi azonosító birtokában elkészíti a proxy példányát most már a csak általa ismert szerver oldali singleton példányhoz. Ez a példány már tárolhat a példányszintű mezőiben adatokat, hiszen ezt a példányt csak egyetlen program fogja használni. A többi program, amely szintén becsatlakozik a szerverre, saját azonosítót, saját példányt kap: ekképpen az egyes példányok mezőiben tárolt adatok nem keverednek össze, nem írják felül egymást.

Az interfész DLL-tartalma:

         
namespace Szolgaltatas 
{ 
   public interface IPeldanykero 
   { 
      string peldany_generalas(); 
   } 
 
   interface ITelefonInfo 
   { 
      bool bejelentkezes(string user, string jelszo); 
      string info(string telefonszam); 
   } 
}
          

A szerver oldalon implementáljuk először a IPeldanykero interfészt, az alábbi módon:

      
class Peldanykero: MarshalByRefObject, Szolgaltatas.IPeldanykero 
{ 
   public string peldany_generalas() 
   { 
      string id= Guid.NewGuid().ToString(); 
      RemotingConfiguration.RegisterWellKnownServiceType 
         ( 
          typeof(Telefon), 
          id, 
          WellKnownObjectMode.Singleton 
         ); 
      return id; 
   } 
}
     

Ezek után implementáljuk a Telefon objektumosztályt, kihasználva azt, hogy itt minden példány egyedi lesz, tehát visszatérhetünk a 8.5. oldalon látható megoldáshoz.

      
class Telefon:MarshalByRefObject, ITelefonInfo 
{ 
   protected int felhasznaloSzintje = 0; 
   //  .................   
   public bool bejelentkezes(string user, string jelszo) 
   { 
    this.felhasznaloSzintje = 
      [ select szint from userek where 
         user=’<user>’ and jelszo=’<jelszo>’ ] 
   } 
   //  .................   
   string info(string telefonszam) 
   { 
    if (this.felhasznaloSzintje>=5) 
      return "<reszletes␣informaciok>"; 
    else 
      return "<igen/nem␣info>"; 
   } 
}
     

A szerver oldali főprogramban csak a Peldanykero osztályt engedjük ki a külvilág felé.

      
class FoProgram 
{ 
static void Main() 
{ 
  string portSzam = ConfigurationSettings.AppSettings["portSzam"]; 
  TcpChannel chan = new TcpChannel( int.Parse( portSzam ) ); 
  ChannelServices.RegisterChannel( chan, false ); 
  RemotingConfiguration.RegisterWellKnownServiceType 
   ( 
    typeof( Peldanykero ), 
    "Peldanykeres", 
    WellKnownObjectMode.Singleton 
   ); 
   Console.ReadLine(); 
} 
}
     

A kliens pedig az alábbi módon járhat el. Első lépésben készít egy proxyt a példánykéréshez, kér a szervertől egy egyedi azonosítót (ID). A továbbiakban készít egy újabb proxyt, ezúttal az egyedi példányhoz, melynek csak ő ismeri az azonosítóját, majd használja azt a példányt mint a sajátját.

      
class FoProgram 
{ 
static void Main() 
{ 
  IPeldanykero m = (IPeldanykero)Activator.GetObject 
  ( 
   typeof( IPeldanykero ), 
   "tcp://localhost:8085/Peldanykeres" 
  ); 
  string id = m.peldany_generalas(); 
  ITelefonInfo m = (ITelefonInfo)Activator.GetObject 
  ( 
   typeof( ITelefonInfo ), 
   "tcp://localhost:8085/"+id 
  ); 
  m.bejelentkezes("alma","titok"); 
      string inf = m.info("+36201234567"); 
      // ... 
}
     

Kliens-aktivált példány

Jegyezzük meg, hogy nagy terheltségű rendszerben minden kliens számára saját példányt biztosítani erősen erőforráspazarló módszer. A kliens-aktivált szerver oldali példányok végső soron ugyanezt biztosítják, mint azt a fenti, nem túl egyszerű megoldással kierőszakoltuk.

A szerver oldali „App.config” fileban a szolgáltatás aktiválását kliens oldali kéréshez kötjük:

         
<configuration> 
  <system.runtime.remoting> 
    <application name="MyRemoting"> 
      <service> 
         <activated type="Telefon,␣PhoneInfo" /> 
      </service> 
      <channels> 
         <channel ref="http" port="9999" /> 
      </channels> 
    </application> 
  </system.runtime.remoting> 
</configuration>
          

A kliensben a proxy példány létrehozását pedig nem az Activator.GetObject -re bízzuk, hanem a CreateInstance-re:

      
object[] activateAttribute = 
 {new UrlAttribute("http://localhost:9999/PhoneInfo")}; 
 
ITelefonInfo m = 
  (ITelefonInfo) Activator.CreateInstance(typeof(ITelefonInfo), 
     null, activateAttribute);
     

A CreateInstance az adott típusból hoz létre példányt. Amennyiben a harmadik paramétere (activateAttribute) is ki van töltve, úgy működése nagyon hasonlít az Activator.GetObject működésére – vagyis a példány valójában csak egy proxy példány lesz. A példány ténylegesen a szerveren jön létre, de a szerver oldali példány csakis ezen proxy példánnyal fog tudni kommunikálni. E módon létrehozott szerver oldali példány tehát egyedi lesz. A példányszintű mezőiben képesek leszük adatokat tárolni, mely csakis ehhez a kliens példányhoz tartozik. Az ilyen szerver oldali példányokat kliens-aktivált[24] példányoknak nevezzük.

A kliens-aktivált szerver oldali példányokkal sok a probléma. Életciklusukat a kliens szabályozza, a létrehozásának időpontja a kliens oldali kód futásához köthető, csakúgy mint a megszűnésének időpontja is. Ez lehet a kliens lecsatlakozása, vagy a kliens oldalról érkező kérelem a szerver oldali példány megszüntetésére. A kliens nem szokta ezt a kérést „elsietni”, hiszen nem a kliens oldali erőforrásokat köti le a példány. A kliens oldaláról beérkező „megszűntetési kérelem” hálózati vagy egyéb hibából esetleg sosem érkezik be. Ezért a szerver oldalon életciklussal kapcsolatos szabályokat[25] lehet beállítani, mint pl. „megszüntethető 40 perc működés után”. A időlimitet elérve a szerver kérdést intéz a kliens felé, hogy kívánja-e meghosszabbítani a szerver oldali példány létezését. Ha a kliens nem válaszol megadott időn belül (timeout), akkor a szerver oldali példány törlődik.

A .NET-ben ez a megoldás csak később került be. Az MSDN ajánlása szerint ez csak egy hiánypótló megoldás, maga a Remoting technológia használata ma már ellenjavalt. Az elosztott alkalmazások fejlesztésére a Windows Communication Foundation használata ajánlott.

Összefoglalás

Az ebben a fejezetben bemutatott RPC technikák olyan ismeretekkel bővítették tudásunk, mely a Communication Foundationnel való ismerkedés alapjait veti meg. Az alacsony szintű socket (stream) módszerekkel szemben itt már kevesebb plusz munkát kell végeznünk a kívánt eredmény eléréséhez. Az RPC motor nemcsak többféle protokollt tud kezeleni (TCP, HTTP), de eleve képes többszálú, több klienssel egy időben kapcsolatot tartó működésre.

A szerver oldali kódok megírása során természetesen hasznát látjuk a korábbi fejezetekben megismert szálkezeléssel és védett blokkokkal kapcsolatos ismereteinknek.

Megismertük, hogyan közlekednek az adatok a kliens és a szerver között bináris vagy stringalapú streameken keresztül. A következő problémakör, amellyel foglalkoznunk kell, éppen ezzel lesz kapcsolatos. Meg kell tudnunk mi az a serialization!



[20] A DLL régebbi elnevezés, a Win16, Win32 programozási modell részeként fontos szerepet játszott. A .NET Framework modellben az új neve assembly (szerelvény), de a generált fájl kiterjesztése a diszken továbbra is .dll lesz

[21] Garbage Collector

[22] Uniform Resource Locator – egységes erőforrás-azonosító

[23] Globally Unique IDentifier

[24] client activated

[25] lifetime lease, melyet a lifetime service kezel

9. fejezet - Szerializáció

Az RCP fejezet kapcsán megismerkedhettünk egy igazán egyszerű módszerrel, ahogyan a szerver oldalon létező meglévő függvényt meghívhatunk. A hívás során a kliens oldalon egy proxy példány generálódik le, mely tartalmazza a szerver oldali függvények lokális másolatát – legalábbis ami a nevet, paraméterezést, visszatérési típust illeti. A függvény törzse azonban mindössze annyi kódot tartalmaz, amennyi a proxy függvény által fogadott paramétereket átküldi a szerver oldali igazi függvénynek, megvárja a visszatérési értéket, fogadja azt a hálózaton keresztül, majd saját visszatérési értékként adja azt meg.

Ez a módszer könnyen elképzelhető, könnyen működtethető egyszerű típusok esetén, de mi a helyzet összetettebb esetekben? Tegyük fel, hogy a függvény egy stringet fogad paraméterként, mely egy fájl neve, amelyben további adatokra lehet bukkanni! Ha a függvény nem proxyfüggvény lenne, valóban működőképes függvénytörzzsel, meg tudná nyitni a fájlt, majd ki tudná olvasni a tartalmát. De ha ez egy proxyfüggvény, a fájlnevet (mely csak ezen, a kliens számítógépen értelmezhető) hiába küldi el a szervernek, az ilyen nevű fájlt a saját diszkjén nem fog találni (és ez a jobbik eset, nagyobb baj általában, ha talál).

Természetesen nem életszerű fájlnevet paraméterként váró függvényt szerver oldalon implementálni pontosan ezért. De mi a helyzet egy törtszámokból (double) álló lista paraméterű függvény implementálásakor? A lista egy referenciatípus, ha ilyen függvényt tervezünk, a paraméter értékeként a hívás helyéről csak a lista memóriacímét adja át a rendszer. A proxyfüggvény értelemszerűen nem ezt a memóriacímet küldi át a szerver oldali valódi függvényhez, mert mihez is kezdene azzal a szerver?

A proxyfüggvénynek két problémával kell foglalkoznia:

  • melyek azok az adattípusok, melyeket lehetetlen a hálózaton keresztül átküldeni,

  • hogyan kell egy összetett adattípusú értéket a hálózaton átküldeni?

Kezdjük a második problémával! Azt a tevékenységet, amikor egy értéket, adatszerkezetet olyan formára alakítunk, amely külső adattárolóra lementhető, és amelyből az eredeti állapot később helyreállítható, szerializálásnak (serialization) nevezzük. Magyarra sorosításként lehetne fordítani, de ez nem túl szerencsés, így ezen jegyzetben maradunk a szerializálásnál. A szerializálás során előállított forma fájlba, memóriapufferbe, hálózati streamre írható, onnan beolvasható kell, hogy legyen. A helyreállítási folyamatot deszerializációnak (deserialization) nevezzük.

A szerializálás fogalma nem írja elő egyértelműen a byte-sorozat képzését (ezt bináris formának nevezzük), ez lehet string formátum is, illetve, mint látni fogjuk, akár XML is.

Első lépésben vizsgáljuk meg a bináris szerializáció lehetőségeit, problémáit, aminek során az egyik számítógép (kliens) memóriájában található értékeket akarjuk olyan formára alakítani, hogy a hálózati kapcsolaton (stream) átküldhető legyen a másik (szerver) számítógéphez, ahol a helyreállítási folyamat végbe kell, hogy menjen.

Egyszerű adattípusok esetén ez könnyűnek tűnik. Egy double típusú érték a memóriában 8 byte, ezzel a byte-sorozat előállítása máris adott. Valóban ilyen egyszerű? A double típus a PC matematikai koprocesszora számára optimális, az IEEE 754-2008 szabvány szerinti felépítésű, 1 előjelbit, 11 bit karakterisztika, 52 bites (egyes normalizált) mantissza. Mi történik azonban, ha a szerver gép nem ilyen értelmezéssel tárolja a memóriában a double típusú adatokat?

Az int egy 4 bájtos tárolású előjeles egész. A 4 byte sorrendje azonban little-endian vagy big-endian szerinti sorrendű? És a szerver processzoránál mi az elvárás?

A char a Frameworkben 2 byte-os Unicode kódolású. Ennek megfelelően a string típusú adatok is 2 byte-os karakterekből álló sorozatok, melyeket egy 0 kódú karakter zár a memóriában. A szerver biztosan nem 1 byte-os ASCII kódolásként érti a karaktertípust? Biztosan lezáró 0 karaktert vár a string végén, nem inkább először várja a string hosszát, majd csak utána a stringet felépítő karaktereket?

Az egyszerű adattípusok esetén is meg kell bizonyosodni, hogy a küldő oldal és a fogadó oldal az egyszerű adattípusok memóriabeli ábrázolásán ugyanazt érti-e. További problémákra kell számítani az összetett adattípusok (tömb, rekord, lista, osztály) szerializációja esetén.

Első lépésben tisztázzuk: értelemszerűen csak olyan adattípusokat van esélyünk szerializálni és deszerializálni, amelyek a kliens és a szerver oldalon is ismertek. Mi ennek a feltétele? Ha mindkét oldalon Framework van, akkor a Framework adattípusainak mindegyikét ilyennek gondolhatjuk. A saját (felhasználó által definiált) típusokkal azonban már problémák lehetnek. Ezeket érdemes a korábban az RPC kapcsán ismertetett interfészbe helyezni, mert azt a kliens és a szerver kódja is magába emeli.

Ezenfelül esélytelen olyan adattípusokat szerializálni, amelyek tartalmaznak hivatkozást valamely, csak a kliens számítógépen rendelkezésre álló (idegen) erőforrásra (memória, fájl stb.). Az idegen erőforrást jelenleg nem könnyű értelmezni, fogalmazzunk úgy, hogy itt elsősorban a Framework által nem menedzselt pointerekről van szó. Ugyanis a Framework által kezelt referenciák szintén a Framework által ismert valamely osztálypéldányra mutat.

Bináris szerializáció

Próbáljuk ki a bináris (byte-sorozatszerű) szerializációt példákon keresztül, és ismerjük meg az alapfogalmakat és az alapproblémákat!

Egyszerű kódot írunk a kipróbáláshoz. Először is a 8.1. fejezetben leírtak szerint adjuk hozzá a projekthez a System.Runtime.Serialization assemblyt! Szükségünk lesz egy fájlstreamre, amelyben a kapott byte-sorozatot ki tudjuk írni. A legfontosabb osztály a BinaryFormatter, melyből készítünk egy példányt. A kapott példány Serialize metódusát kell csak meghívnunk, mely paramétereként kapja a fájlstreamet, amelybe az eredményt ki kell írnia, valamint a szerializálandó adatot. Első lépésben szerializáljunk egy egész számot!

         
using System.Runtime.Serialization.Formatters.Binary; 
using System.IO; 
 
class Program 
{ 
 static void Main(string[] args) 
 { 
   int x = 12; 
   // 
   FileStream file = new FileStream(@"c:\akarmi.bin", FileMode.Create); 
   BinaryFormatter w = new BinaryFormatter(); 
   w.Serialize(file, x); 
   file.Close(); 
 } 
}
          

9.1. ábra. Az akarmi.bin fájl tartalma

Egyetlen int típusú adat a memóriában 4 byte-ot foglal el. Ha megnézzük a diszken a fájl méretét: 54 byte. Látszik tehát, hogy itt nem egyszerűen arról van szó, hogy a memóriabeli 4 byte alkotja a szerializált byte-sorozatot. A 9.1. ábrán láthatjuk, hogy szerepel a fájlban például a System.Int32 karaktersorozat, valamint az m_value szavak is. A 12 értéket magát tetten érhetjük: az utolsó sorban szerepel 4 byte, hexadecimálisan 0C 00 00 00, melyet egy 0B érték zár le. A hexadecimális 0C az a decimális 12 érték.

A szerializáció során a tényleges érték elé íródik tehát egy olyan bevezető információmennyiség, mely egyértelműsíti, hogy milyen típusú adatról van szó, hogyan kell majd a deszerializáció során a tényleges értékeket tartalmazó adatsort értelmezni.

A deszerializációs tesztprogramunk az alábbi módon néz ki:

         
using System.Runtime.Serialization.Formatters.Binary; 
using System.IO; 
 
class Program 
{ 
 static void Main(string[] args) 
 { 
    FileStream file = new FileStream(@"c:\akarmi.bin", FileMode.Open); 
    BinaryFormatter r = new BinaryFormatter(); 
    int x = (int)r.Deserialize(file); 
    file.Close(); 
    Console.WriteLine(x); 
    Console.ReadLine(); 
 } 
}
          

Jegyezzük meg, hogy egyetlen ilyen stream (fájl) nem csak egyetlen szerializált adatot tartalmazhat! Az int típusú adat után ugyanebbe a fájlba írhatunk további adatokat is:

      
 // ... 
 int x = 12; 
 w.Serialize(file, x); 
 double d = 14.5; 
 w.Serialize(file, d); 
 // ...
     
      
 // ... 
      int x = (int)r.Deserialize(file); 
      double d = (double)r.Deserialize(file); 
 // ...
     

A beolvasás során ügyeljünk a helyes sorrendre! Mivel a bináris fájl tartalmazza a típusinformációkat is, ha elvétjük a beolvasási típusokat, akkor kivételt kapunk (9.2. ábra).

9.2. ábra. Helytelen típus olvasásakor kivételt kapunk

Saját típus szerializációja

Folytassuk ismerkedésünket egy saját adattípus, egy bevasarloKosar osztály szerializációjával! Ezen osztály példányai tárolják a felhasználó által vásárolt termék adatait.

         
class bevasarloKosar 
{ 
public string nev; 
public double egysegAr; 
public int afaKulcs; 
public int darabSzam; 
}
          

Egyszerű felépítésű osztály, nincsenek benne összetett típusú mezők. Próbáljuk szerializálni az alábbi kóddal (a futási eredményt lásd a 9.3. ábrán):

         
bevasarloKosar p = new bevasarloKosar(); 
p.nev = "Led␣TV"; 
p.egysegAr = 140000; 
p.afaKulcs = 25; 
p.darabSzam = 2; 
 
FileStream file = new FileStream(@"c:\bevasarlas.bin", FileMode.Create); 
BinaryFormatter w = new BinaryFormatter(); 
w.Serialize(file, p); 
file.Close();
          

9.3. ábra. Saját típus szerializációja – első kísérlet

A SerializationException leírásában olvashatjuk az indoklást: type bevasarloKosar is not marked as serializable – a bevasarloKosar típus nincs megjelölve mint szerializálható típus.

Serializable

A bináris szerializációt végző metódus első lépésben egy biztonsági ellenőrzést hajt ugyanis végre: amely adattípust a fejlesztő nem jelölt meg mint szerializálható adattípust, azt tilos byte-sorozattá alakítani. Azt feltételezi ugyanis a metódus, hogy a nem megjelölésnek oka van: valamely mezőjében esetleg olyan adatot tárolunk, mely titkos, vagy más okból nem szabad, hogy kikerüljön a Framework védett, menedzselt memóriaterületéről.

Jelen esetben ez nem áll fenn, csak egy adminisztratív lépést kell tehát tennünk. A megjelölést a C# nyelven attribútumok segítségével lehet megtenni. Az attribútumot szögletes zárójelben kell megadni, és mivel most a teljes típusra kívánjuk vonatkoztatni, ezért a típusdefiníció elé kell írni:

         
[Serializable] 
class bevasarloKosar 
{ 
public string nev; 
public double egysegAr; 
public int afaKulcs; 
public int darabSzam; 
}
          

Az eredményül kapott fájl (esetünkben) 195 byte hosszú, ha belenézünk, szerepel benne a típus neve, a mezők nevei, típusai is. A tényleges adattartalom a fájl végén lesz (9.4. ábra).

9.4. ábra. A bevasarloKosar példány bináris szerializációjának eredménye

Tegyük fel, hogy programunk lefutott korábban, fájlban tárolta el a bevásárlókosarunk egyik vásárolt termékét a fentiek szerint! Időközben a programunkon fejlesztést hajtottunk végre: kiegészítettük a fenti osztályt egy új mezővel, amelyben a termék vonalkódját tároljuk el.

         
[Serializable] 
class bevasarloKosar 
{ 
public string vonalkod; 
public string nev; 
public double egysegAr; 
public int afaKulcs; 
public int darabSzam; 
}
          

Próbáljuk meg helyreállítani a régi fájl alapján a vásárolt termékünk adatait! Rosszat sejtünk, mivel amikor még a bevasarlas.bin fájl készült, ez a mező nem szerepelt az osztályban, így a fájlban sincs nyoma. Döbbenetes – a deszerializáció mégis hibátlanul működik:

         
 FileStream file = new FileStream(@"c:\bevasarlas.bin", FileMode.Open); 
 BinaryFormatter r = new BinaryFormatter(); 
 bevasarloKosar p = (bevasarloKosar)r.Deserialize(file); 
 file.Close(); 
 Console.WriteLine("{0}␣{1}",p.nev,p.darabSzam); 
 Console.ReadLine();
          

Annak ellenére működik, hogy az új mezőt a többi elé helyeztük el a típus definíciójában. A deszerializáció a mezők sorrendjétől függetlenül működik, köszönhetően annak, hogy a fájlban nemcsak a mező értékei, de a mezők nevei is szerepelnek, így minden kiírt adatot a megfelelő mezőbe helyez el. Amely mezőben nem tud értéket elhelyezni (mert az még nem szerepelt a fájlban), azt alapértelmezett értékén hagyja.

Optional

Nem minden Framework-verzióban volt az, hogy az utólag beillesztett mezők hiányában is működött a deszerializáció. Korábbi verziókban ilyen esetben szintén kivételt kaphattunk. Ezt úgy lehetett megkerülni, hogy az újonnan beillesztett mezőt elláttuk az Optional attribútummal. Ez jelezte a deszerializációt végző kódnak, hogy ha ezen mező nem szerepel a streamben, akkor nem kell kivételt dobnia, elég azt alapértelmezett értéken hagynia.

      
[Serializable] 
class bevasarloKosar 
{ 
[Optional] 
public string vonalkod; 
public string nev; 
public double egysegAr; 
public int afaKulcs; 
public int darabSzam; 
}
     

Újabb kísérletünkhöz töröljünk ki egy mezőt az osztályból, egy olyan mezőt, amely a szerializációkor még szerepelt, emiatt a fájlban is szerepel a neve, valamint az akkori értéke is! Legyen ez a darabSzam mező! Próbáljuk meg az eredeti fájl tartalmát szerializálni! Szintén azt találjuk, hogy a 4.0 Frameworkben ez sem okoz kivételgenerálást. A deszerializációs folyamat során tehát ha olyan mezőre bukkan az eljárás, amelynek a neve már ismeretlen, nem szerepel a jelenlegi osztályban, akkor azt figyelmen kívül hagyja.

Megállapíthatjuk tehát, hogy adott típusú adatok szerializációja, deszerializációja meglehetősen stabilan működik akkor is, ha a típuson időközben átalakításokat végeztünk: új mezőkkel egészítettük ki, mezőket távolítottunk el. Mi történik, ha a mező típusát módosítjuk? Az afaKulcs jelenleg int típusú, módosítsuk short típusra, majd próbáljuk az eredeti fájlt deszerializálni.

9.5. ábra. Az afaKulcs típusmódosítása után

Mint a 9.5. ábrán is láthatjuk, ez a lépés kivétel dobását váltja ki. Úgy tűnik, a mező típusának módosítása nem megengedhető lépés. Még akkor sem, ha egyébként maga az érték (az int típusú mező értéke a szerializációkor 25 volt) az új típusban is tárolható lenne.

         
[Serializable] 
class bevasarloKosar 
{ 
public string nev; 
public double egysegAr; 
public int afaKulcs; 
public int darabSzam; 
 
}
          

NonSerialized

Bővítsük most más okból az osztályt! Az új fizetendo mező valójában a nettó ár (egysegAr), az áfakulcs, és a darabszám ismeretében kalkulálható, csak azért vettük bele, hogy a programban több helyen is szereplő fizetendő végösszeg kiszámítását könnyítse. Ezen mező értékét igazából nem kell szerializálni, mert ha a többi mező értékét sikerül helyreállítani, akkor egy képlet alkalmazásával ezen mező értéke is reprodukálható.

Az ilyen mezőket (a bináris folyam hosszának csökkentése, optimalizálása miatt) a NonSerialized attribútummal szokták ellátni. Ez utasítja a szerializációs eljárást, hogy ezen mező értékét ne vegye bele a kimeneti byte-sorozatba.

         
[Serializable] 
class bevasarloKosar 
{ 
public string nev; 
public double egysegAr; 
public int afaKulcs; 
public int darabSzam; 
[NonSerialized] 
public int fizetendo; 
}
          

Ha megtekintjük az eredményül kapott fájl tartalmát, a mezők neveinek felsorolásakor továbbra sem fog szerepelni a fizetendo mező, sem a neve, sem a benne szereplő érték nem kerül be a fájlba.

Mindazonáltal azt tapasztaljuk, hogy ennek megfelelően a deszerializáció sem állítja helyre a mentéskori értéket (honnan is lenne képes erre?). Mit tegyünk? A megoldás az, hogy implementálnunk kell az IDeserializationCallback interfészt, mely előírja, hogy készítsünk el egy speciális metódust az osztályba. Ennek neve OnDeserializaton kell, hogy legyen, egy paraméteres, void visszatérésű. Ezt a metódust a deszerializációs függvény meg fogja hívni, jelezvén, hogy minden lehetséges mező értékét visszatöltötte, s ekkor lehetőségünk van a számolt mezők értékét képletek, függvényhívások segítségével helyreállítani.

      
[Serializable] 
public class bevasarloKosar : IDeserializationCallback 
{ 
 public string nev; 
 public double egysegAr; 
 public short afaKulcs; 
 public int darabSzam; 
 [NonSerialized] 
 public int fizetendo; 
 // 
 public void OnDeserialization(Object sender) 
 { 
    fizetendo = (int)(egysegAr * (1 + afaKulcs / 100.0) * darabSzam); 
 } 
}
     

Lista manuális szerializációja

Hasonló eredményt érhetünk el, ha listát készítünk a bevásárlókosár példányokból (hiszen egy bevásárlás során több mindent is veszünk). Próbáljuk ki, hogy lehet egy ilyen adathalmazt szerializálni! Definiáljunk egy kételemű listát, majd írjuk ki a lista tartalmát fájlba!

      
List<bevasarloKosar> l = new List<bevasarloKosar>(); 
// 
bevasarloKosar p = new bevasarloKosar(); 
p.nev = "Led␣TV"; 
p.egysegAr = 140000; 
p.afaKulcs = 25; 
p.darabSzam = 2; 
p.fizetendo = (int)(p.egysegAr * (1 + p.afaKulcs / 100.0) * p.darabSzam); 
l.Add(p); 
// 
bevasarloKosar q = new bevasarloKosar(); 
q.nev = "Házimozi"; 
q.egysegAr = 140000; 
q.afaKulcs = 25; 
q.darabSzam = 1; 
q.fizetendo = (int)(q.egysegAr * (1 + q.afaKulcs / 100.0) * q.darabSzam); 
l.Add(q); 
// 
FileStream file = new FileStream(@"c:\bevasarlas3.bin", FileMode.Create); 
BinaryFormatter w = new BinaryFormatter(); 
w.Serialize(file, l.Count); 
foreach(bevasarloKosar r in l) 
 w.Serialize(file, r); 
file.Close();
     

A kód szintaktikailag hibátlan, generál egy 443 byte méretű fájlt a diszken. Ha belenézünk, látjuk, hogy szerepelnek benne a mezők adatai, hibátlannak néz ki. Próbáljuk meg helyreállítani!

         
FileStream file = new FileStream(@"c:\bevasarlas3.bin", FileMode.Open); 
BinaryFormatter r = new BinaryFormatter(); 
int n = (int)r.Deserialize(file); 
List<bevasarloKosar> l = new List<bevasarloKosar>(); 
for (int i = 0; i < n; i++) 
{ 
   bevasarloKosar p = (bevasarloKosar)r.Deserialize(file); 
   l.Add(p); 
} 
file.Close(); 
foreach (bevasarloKosar p in l) 
   Console.WriteLine("{0}␣{1}", p.nev, p.egysegAr); 
Console.ReadLine();
          

Lista automatikus szerializációja

Az előző kód sikerén felbuzdulva próbáljuk ugyanezt egyszerűbben megtenni! Próbáljuk meg nem manuálisan szerializálni a listát (először kiírni az elemszámát, majd az elemeket egy ciklusban), hanem direktben a listát szerializálni (a rövidség kedvéért ez esetben kihagytuk a lista feltöltését):

      
List<bevasarloKosar> l = new List<bevasarloKosar>(); 
// ... 
FileStream file = new FileStream(@"c:\bevasarlas4.bin", FileMode.Create); 
BinaryFormatter w = new BinaryFormatter(); 
w.Serialize(file, l); 
file.Close();
     

Egyrészt annak örülünk, hogy a kód nem jelez fordítási hibát (ezek szerint a List<T> a szerializálásra megjelölt típus), másrészt futás közben sem kapunk hibát (tehát működik is). A kapott fájl hossza kereken 500 byte (ami jót jelent a korábbi 195 byte-tal szemben), és ha belenézünk a fájlba, megtaláljuk benne könnyedén a „Házimozi” és „Led TV” karaktersorozatokat is, ami biztatóan mutatja, hogy mindkét példányunk mezői szerepelnek a byte-sorozatban. A helyreállítás sem nehéz:

      
FileStream file = new FileStream(@"c:\bevasarlas4.bin", FileMode.Open); 
BinaryFormatter r = new BinaryFormatter(); 
List<bevasarloKosar> l = (List<bevasarloKosar>)r.Deserialize(file); 
file.Close(); 
Console.WriteLine("{0}",l.Count); 
Console.ReadLine();
     

Rekurzív szerializáció

Valóban ennyire könnyű lenne az összetett adatszerkezetekkel való bánásmód? Melyik módszert válasszuk? Nyilván a második szimpatikus, hiszen sokkal rövidebb a kód, amit írnunk kell (s emiatt kisebb a hibalehetőség is). Van azonban még egy ok, melyet figyelembe kell vennünk. Hogy megértsük ezt az okot, képzeljünk el egy másik példát! Listánkban személyek (férfiak és nők) adatait tároljuk, melyek kis városunkban laknak. A házastársi kapcsolatban élő személyek esetén a házaspár referenciáját is tároljuk. Legyen ezenfelül egy újabb osztály is, a születési hely leírásával!

                                                                                                                                     

                                                                                                                                     
         
[Serializable] 
public class varos 
{ 
 public string nev; 
 public string orszagKod; 
} 
 
[Serializable] 
public class szemely 
{ 
 public string nev; 
 public int szul_ev; 
 public bool ferfi_e; 
 public varos szuletett; 
 public szemely hazastarsa; 
}
          

Töltsük fel a listát 3 személlyel! Ebből 1 házaspár, 1 egyedülálló. A kód egyszerűsítése miatt tételezzük fel, hogy a fenti két osztálynak vannak konstuktorai, melyek segítségével a mezők értékeit az adott sorrendben be lehet állítani:

      
varos v1 = new varos("Eger","HU"); 
varos v2 = new varos("Debrecen","HU"); 
szemely p1 = new szemely("Lajos",1970,true,v1,null); 
szemely p2 = new szemely("Gizi",1974,false,v2,null); 
szemely p3 = new szemely("Marcsi",1977,false,v1,null); 
p1.hazastarsa = p2; 
p2.hazastarsa = p1; 
List<szemely> lakok = new List<szemely>(); 
lakok.Add(p1); 
lakok.Add(p2); 
lakok.Add(p3);
     

A jobb megérthetőség miatt ábrázoljuk ezt a kapcsolatrendszert gráfon is (9.6. ábra)!

9.6. ábra. A személyek listája

A kérdés egyszerű: akarjuk mi ezt a bonyolult kapcsolatrendszert tartalmazó listát manuálisan szerializálni? Nyilván nem. Pedig még bele sem gondoltunk egy részletbe. Vegyük azt az elvet, hogy a lista valamely i. elemének szerializációja azt jelenti, hogy ki kell írni a példány mezőit a fájlba, majd fel kell keresni a példány által hivatkozott más példányokat, és az ő mezőit is ki kell írni a fájlba, majd az ezek által hivatkozott példányokat is fel kell keresni stb. Ez egy rekurzív szerializációt igénylő feladat. A lista legelső elemének („Lajos”) szerializációjának folyamata során valójában „Gizi”, „Eger” és „Debrecen” szerializációja is megtörténik (és nem szabad beleesni abba a csapdába, hogy a „Gizi” példány visszahivatkozik a „Lajos”-ra, nem szabad végtelen rekurzióba kezdeni).

Amikor az első példány kiírásával készen vagyunk, következhet a második példány. Azonban „Gizi” és minden hivatkozása korábban már szerializálásra került, pazarlás lenne újra kiírni az adatait.

Amikor már átérezzük, mennyi csapdát kell elkerülnünk egy bonyolultabb, összetettebb szituációban, akkor igazán hálásak lehetünk annak, hogy a Framework szerializációs függvényét készítő fejlesztők ezt már mind végiggondolták. Hagyatkozzunk inkább az ő munkájukra, mintsem mi kezdjünk neki egy ilyen eset manuális szerializációját megírni!

Összefoglalás

Az RPC módszer kapcsán olyan függvényeket terveztünk, melyek paramétereket fogadnak a hálózati streameken keresztül a proxy példányoktól, s a szerver oldali kód lefutása után kapott eredményt visszaküldik a kliens oldalra. Ha az RPC során TCP csatornát használunk, akkor a hálózati streameken bináris szerializáció folyik a kliens és a szerver között.

A kliens szerializálja a paramétereket, átküldi egy bináris streamen. A szerver deszerializálja a paramétereket, elvégzi a kért műveletet, a kapott eredményt hasonló lépéseken keresztül juttatja vissza a klienshez.

Miért érdemes erről tudni? Mert két dologra kapunk választ:

  • hogyan lehet saját adattípust használni RPC közben függvényparaméterekként vagy visszatérési értékként,

  • miért fordul időnként elő az, hogy bizonyos típusokat nem fogad el az RPC módszer mint paramétert vagy mint visszatérési típust?

Amennyiben alaposan megértettük, hogyan működik a szerializálás, deszerializálás, és tudomásul vesszük, hogy az RPC motorja ezt a technológiát használja, úgy a fenti kérdésekre a válasz már egyszerűen adódik.

10. fejezet - Web Service

A streamalapú, de akár az RPC jellegű szerverek esetén is vannak komoly problémák:

  • különálló portot igényel,

  • a stream alapú megoldás a saját kommunikációs protokoll miatt nem szabványos (kivéve ha eleve valamilyen szabványos protokollt implementál, pl. IMAP),

  • az RPC ugyan szabványos protokoll, de csak .NET környezeten belül, így a kliens fejlesztése is .NET alapokon kell történjen,

  • a titkosítás, azonosítás, hitelesítés, egyéb üzenetváltással kapcsolatos problémák kezelése nehezen megoldható.

A különálló port is egy komoly probléma. Ezt a problémát nem a programozók érzik meg, mivel számukra ez egyszerű probléma, az alkalmazáskonfigurációs fájlban megadhatjuk ezt a portot, a tényleges éles üzemű szerver alkalmazást a rendszergazda fogja majd telepíteni, és a tényleges portot majd ő meghatározza.

A rendszergazda korántsem örvendezik. Nem azért, mert órákig kell gondolkodnia, mire szabad portot talál a számítógépen – hanem mert ezt a portot a cég tűzfalain is át kell vezetnie. Ez korántsem szokott triviális feladat lenni. A helyi tűzfalak, biztonsági házirendek módosítása után a hardveres tűzfalak, átjárók konfigurálása következhet[26].

Ezenfelül az új szerver alkalmazást be kell állítani, hogy a számítógép újraindítása után automatikusan induljon el stb. A szerver számítógépen (hardver) a mi szerver programunk mint újabb folyamat működik. Mindenképpen erőforrásokat köt le, processzoridőt, memóriát. Folyamatosan, akkor is, amikor épp egyetlen kliens sem kapcsolódik rá. További menedzselési problémák adódnak, ha a szerver erősen terhelt: mikor vannak a csúcsidők? Hogyan adjuk meg a szerver számára felhasználható maximális sávszélességet? Egyáltalán hova ír a szerver naplót? Ha hiba támad a működésében, hogyan fogjuk eldönteni hogy mi okozta? Sorolhatnánk a kérdéseket, melyre a szerverünket üzemeltető rendszergazdának kellene válaszolni – de nem tud.

Van egy szerver program, melyet a rendszergazda biztosan alaposan ismer, s ami a vállalat külvilág felé nyitott számítógépén biztosan fut: az IIS. Ez a rövidítés az Internet Information Services (korábban ugyanez a három betű az Internet Information Server rövidítése volt). Az MS Windows Server operációs rendszer része, de egyes desktop Windows kiadásokra (XP, Vista stb.), jellemzően a professional és ultimate verziók esetén is telepíthető. Az MS IIS-ről a legtöbben csak annyit tudnak, hogy az is valamiféle webszerver, „de az Apache még ingyenes is”.

Az IIS is egy szerver alkalmazás, mely jellemzően a 80-as portot használja (HTTP), és még néhány más portot is, pl. a 443-as portot ha HTTPS protokoll is engedélyezve van. Az IIS-ről a rendszergazda tudja, hogy folyamatosan fut, tudja nyomon követni a teljesítményigényét, erőforrásigényét, az IIS bőségesen naplózza saját tevékenységét; számtalan eszközt fejlesztettek az IIS futásának elemzésére.

Miért ne használjuk az IIS-t mint szervert? Ez a választás még milyen problémákat oldana meg?

A webszolgáltatások

Mindenki tudja, mi a weblap. A weblap egy olyan adathalmaz, mely az adatokon kívül annak megjelenítésével kapcsolatos leírásokat is tartalmazza egy kifejezetten erre fejlesztett HTML nyelven. Egyetlen webszerver weblapok sorozatát tárolja a lemezen, melyek közül a számunkra kívánatosat lehet letölteni. A weblap azonosítását URL megadásával lehet specifikálni, pl: http://webszerver/arfolyamok/euro/20100506

Igényként merült fel a weblapok dinamikus generálása, mivel az adatok nagy része adatbázisban kerül tárolásra, és ezek segítségével az egyes weboldalak tartalma automatikusan előállítható. A webszerverek képessé váltak kis programok futtatására, melyek akkor indultak el, amikor a felhasználók valamely olyan weblap tartalmát igényelték, amelyet ezen pici programoknak kellett generálni[27].

A webszerverek által futtatható programok ma már paramétereket is képesek fogadni az URL-ben. A http://webszerver/arfolyam?tipus=euro&datum=20100506 típusú linkek pontosan ilyenek. A program neve esetünkben arfolyam, két paramétere van, tipus és datum nevűek, melyek értékei is szerepelnek az URL-ben[28]. Ez a működés máris nagyon hasonlít az RPC modell működésére.

Nem árt tudnunk: az IIS sokkal egyszerűbb működésű szoftver, mint amit elsőnek gondolhatunk róla[29]. A bejövő URL alapján szolgai módon elindítja a megnevezett programot[30], a paramétereket átadja neki. Megvárja, míg a folyamat befejeződik, s annak outputját visszaküldi a kliensnek. Valójában nincs arról semmilyen elképzelése, mit csinál a szóban forgó folyamat, sem arról, hogy annak kimenete valóban HTML-e (mint ahogy elég gyakran nem az).

Nem tűnik problémásnak az IIS használata, hiszen mint látjuk, az IIS eleve képes programokat futtatni, az egyes programhívások között pedig paraméterek kezelésével lehet különbséget tenni. Az IIS nem kívánja meg, hogy a kimenet HTML legyen.

Egy konkrét webszolgáltatás nem más, mint valamely webszerverre telepített függvények egy halmaza, mely függvényeket az adott webszerveren keresztül (hagyományosan) HTTP protokoll segítségével lehet indítani. Ez egyfajta lényegkiemelés, de ez hogy valóban webszolgáltatásról beszéljünk – ennél sokkal több kell:

a webszolgáltatás valamely alkalmazások közötti adatcserére szolgáló protokollok és szabványok gyűjteménye.

A gyűjteménybe tartozó protokollok és szabványok leírása mindenki által hozzáférhető és implementálható. E miatt a webszolgáltatások segítségével eltérő programozási nyelven írt, eltérő operációs rendszerek alatt futó programok is képesek egymással kommunikálni (interoperabilitás). A kommunikáció során küldött-fogadott adatok jellemzően XML alakban kerülnek leírásra. Az XML dokumentum szerkezetét a SOAP szabvány írja le. Az XML formájú adatokat szintén szabványos protokollok (FTP, HTTP, SMTP, XMPP, HTTPS stb.) segítségével lehet egyik géptől a másikig eljuttatni. Valamely webszolgáltatás által elérhető szolgáltatásokat[31] a WSDL (Web Service Description Language) szabvány által leírt formában kell publikálni. Magáról a webszolgáltatásról általános információkat a UDDI szabvány szerint lehet megadni (ebben belefoglalható pl. a WSDL leíró dokumentum elérhetősége is).

Esetünkben (C# nyelven programozva) a megfelelő webszerver az IIS lesz. A továbbiakban megismerkedünk azzal, milyen fogalmak léteznek ebben a témakörben, mik a problémák, mik a szokásos megoldásaik, valamint milyen támogatást kapunk a Visual Studiótól webszolgáltatások fejlesztéséhez.

Első webszolgáltatásunk

Készítsük el a 7.2.5. alszakaszban említett egyszerű számológép szolgáltatásainkat webszolgáltatás alapon! Korábbi (nem 4-es verziójú Framework) esetén a Visual Studióban ekkor a websablonok közül az ASP.NET Web Service Application projekttípust kell választani (10.1. ábra). A 4-es Framework esetén a WCF Service a preferált megoldás, így a hagyományos webszolgáltatás projekttípus nincs is a listában. Ekkor egy hagyományos ASP.NET Web Application projektet kell először választani, majd Add new item..., Web Service elemet kell hozzáadni (10.2. ábra).

10.1. ábra. Web Service projekt v3.5 alatt

10.2. ábra. Web Service elem hozzáadása v4 alatt

Generált forráskód mindkét esetben nagyon hasonló, lényegében egyezik korábbi Framework-verziók használata esetén kapott forráskóddal is.

                                                                                                                                     

                                                                                                                                     
         
using System; 
using System.Collections.Generic; 
using System.Linq; 
using System.Web; 
using System.Web.Services; 
 
namespace Szamologep_v4 
{ 
   /// <summary> 
   /// Summary description for szamologep 
   /// </summary> 
   [WebService(Namespace = "http://tempuri.org/")] 
   [WebServiceBinding(ConformsTo = WsiProfiles.BasicProfile1_1)] 
   [System.ComponentModel.ToolboxItem(false)] 
   // To allow this Web Service to be called from script, 
   // using ASP.NET AJAX, uncomment the following line. 
   // [System.Web.Script.Services.ScriptService] 
   public class szamologep : System.Web.Services.WebService 
   { 
 
      [WebMethod] 
      public string HelloWorld() 
      { 
         return "Hello␣World"; 
      } 
   } 
}
          

Két lényeges pont van a kódban:

  • az osztályunk őseként választani kell a WebService osztályt,

  • a metódusunk előtt a [WebMethod] attribútum is szerepeljen!

Értelemszerű, hogy egy ilyen projektben lesz néhány függvény, melyet publikálni szeretnénk, melynek meghívását megengedjük a klienseknek – és lesz néhány függvény, melyek segédfüggvények szerepét töltik be. Elképzelhető teljes segédosztályok létezése is, melyekben nincsenek publikálandó függvények. Nyilván nem szeretnénk elveszíteni az irányítást, meg kívánjuk szabni az ASP.NET motornak[32] mely függvényeket szabad meghívni kívülről a kliensek által, és melyeket nem. Ezen engedélyezési mechanizmus része az említett három fontos rész:

  • a kliensek által meghívható függvényeket a [WebMethod] attribútummal meg kell jelölni,

  • ilyen metódusok csak a WebService osztály gyermekosztályaiban szerepelhetnek,

  • a névtér tulajdonsága, mely egy egyedi URL cím.

A névtér alapértelmezett értéke „http://tempuri.org”. Ezt érdemes megváltoztatni valami egyedi URL címre. Az adott URL címen a böngészők nem feltétlenül találnak tartalmat, a DNS szemponjából még csak IP cím sem feltétlenül tartozik hozzá, lényeg hogy egyedi legyen. A „tempuri.org” általában azt jelöli, hogy ez egy fejlesztés alatt álló webszolgáltatás. Kész állapotában saját névteret kaphat, hogy a benne szereplő osztályok, szolgáltatások megkülönböztethetőek legyenek más, egyező nevekkel bíró webszolgáltatásoktól. Ilyen szempontból tekintsünk rájuk pontosan ugyanolyan szemmel, mint a szokásos C# nyelvi névterekre.

                                                                                                                                     

                                                                                                                                     
         
[WebService(Namespace = "http://sajat.cegem.hu/szamologep")] 
public class szamologep : System.Web.Services.WebService 
{ 
[WebMethod] 
public int osszead(int a, int b) 
{ 
 return a + b; 
} 
 
[WebMethod] 
public int osztas(int a, int b) 
{ 
 if (b == 0) throw new ArgumentException("A␣B␣erteke␣␣nem␣lehet␣nulla"); 
 return a / b; 
} 
}
          

Ezzel kész is vagyunk. Nincs szükség Main függvény írására igazából. A motort nem kell beállítani, az IIS alapértelmezett viselkedése megfelelő. A port rögzített, az mindig az IIS portja lesz (80-as), a protokoll, melyen majd elérhetjük a webszolgáltatásunkat, az a http protokoll lesz. Az URL-t, melyen keresztül a szolgáltatást elérjük, az IIS-ben kell majd beállítani. Nincs más dolgunk, mint telepíteni a kész webszervert az IIS alá.

A telepítést a Solution Explorerben a projekt nevén jobb egérgombbal kattintva a Publish menüponttal kezdeményezhetjük. Az előbukkanó párbeszédablakot kitöltve (szerverválasztás, url-választás stb.). Ez igazából rendszergazdai feladat, ezért ezzel jelenleg nem foglalkozunk behatóan. Helyette egy egyszerűbb módszert választunk a webszolgáltatásunk tesztelésére.

Jelöljük ki a projektet mint kezdő (startup) projekt, és egyszerűen indítsuk el a szokásos módon (F5 vagy Debug/Start debugging stb.). Ekkor a jól telepített Visual Studio esetén elindul egy mini webszerver, melyet ASP.NET Development Servernek nevezünk. Ez nem a 80-as porton indul el (amelyen a „nagy” IIS szerverünk fut), hanem egy véletlen portot választ magának. A portról a Windows Taskbaron felbukkanó kis ikonra húzva tájékozódhatunk (10.3. ábra).

10.3. ábra. Development Server az 59455-ös porton

Képezzük le az alábbi url-t: http://localhost:59455/szamologep.asmx! Az url-beli szerver a korábban említett localhost, a saját számítógépünk. A port a Development Server portja. A továbbiakban az osztály (class szamologep) neve szerepel, majd a generált leíró lap kiterjesztése (.asmx). Ezt az url-t kedvenc böngészőnkbe beírva egy weblap jön be, mely tartalmazza többek között a webszolgáltatásunkban megvalósított két függvény (osszead, osztas) neveit mint linkeket. (10.4. ábra).

10.4. ábra. A webszolgáltatás weblapja

A linkekre kattintva egy egyszerű űrlapot is kapunk, ahol a függvények paramétereinek megadhatjuk az értékét, és megkaphatjuk a függvény visszatérési értékét. A tesztfelületen egy fontos dolgot fedezhetünk fel: SOAP 1.1 (10.5. ábra), melyről a következő fejezet fog szólni. Ezzel együtt ez a weblap kiválóan alkalmas, hogy tesztelhessük, a webszolgáltatásunk működőképes-e.

10.5. ábra. A függvény kipróbálása űrlapon

SOAP-beküldés

A SOAP egy szabvány, mely leírja, hogyan kell felépíteni elsősorban adatokat tartalmazó lapokat XML dokumentumok alakjában. Eképpen ezen XML dokumentum belső szerkezetét definiálja. Ezen dokumentumba nem csak egyszerű adattípusú értékek (int, double stb.), hanem bonyolultabb adatszerkezetek (tömbök, listák, szótárak stb.) is leírhatóak.

Az XML egy olyan kiterjeszthető leíró nyelv, mely egyaránt alkalmas adatok leírására, illetve magának egy XML dokumentum szerkezetének leírására is. Első esetben beszélhetünk klasszikus értelemben vett XML dokumentumról, második esetben XML sémáról. Magát a SOAP szabványt is elolvashatjuk egy XML séma formájában. Egy ilyen XML séma alkalmas arra, hogy összevessük vele egy adatokat tartalmazó XML dokumentum szerkezetét. Erre kész, általánosan megírt alkalmazások vannak, melyeket XML validátoroknak nevezzük.

Ezek a validátorok először beolvassák az XML sémát, majd beolvassák magát az XML dokumentumot. A dokumentumban szereplő XML elemek egymásba ágyazását, számát, nevét, egyéb jellemzőit összevetik a sémában leírtakkal. Ennek alapján eldöntik, hogy az XML dokumentum szerkezete megfelel-e a sémában leírt szabályoknak. Ha megfelel, akkor a dokumentum a séma szerinti „valid” (helyes).

Ha egy webszolgáltatásnak küldünk adatokat, az XML dokumentumunknak SOAP séma szerint validnak kell lennie, a szolgáltatástól visszakapott, a futási eredményt tartalmazó XML dokumentum is hasonlóan SOAP szerinti valid lesz.

A HTML-lel szemben az XML csak az adatokra koncentrál, nem tartalmaz utalást az adatok megjelenítésére. Ezért elsősorban nem vizuális megjelenítés a célja, hanem számítógépes programok használják egymással történő adatcserére. Az XML dokumentumok alapvetően szöveges fájlok, de strukturált módon írhatnak le akár bonyolultabb adatszerkezeteket is.

A SOAP[33] pontosan leírja, milyen elemekből hogyan kell az adatleíró XML-tartalmat felépíteni. A 10.5. ábrán látható egy (valójában kettő) SOAP dokumentum, mely az osszead függvény működtetésével kapcsolatos.

Ezen XML dokumentumban hivatkozva van a meghívandó függvény (osszead) neve, jelölve van, hogy a két paraméter neve „a” és „b”, valamint az egyes paraméterek értékei.

         
<?xml version="1.0" encoding="utf-8"?> 
<soap:Envelope 
   xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
   xmlns:xsd="http://www.w3.org/2001/XMLSchema" 
   xmlns:soap="http://schemas.xmlsoap.org/soap/envelope/"> 
 <soap:Body> 
   <osszead xmlns="http://tempuri.org/"> 
    <a>12</a> 
    <b>14</b> 
   </osszead> 
 </soap:Body> 
</soap:Envelope>
          

A SOAP dokumentum egyetlen célja, hogy ebben az XML formába kell beilleszteni a függvényhívás paramétereit. A hagyományos, webes URL alakban is van lehetőség paraméterek átadására, de ez egy igazi programozási nyelvi függvény esetén, valamely összetett adatszerkezetű paraméter értéke esetén már nem kivitelezhető. Mint az előző fejezetben említettük, az arfolyam?tipus=euro&datum=20100506 formájú alak a szokásos, de ezen módszerrel nagyon nehézkes (majdnem lehetetlen) lenne például a 9.5. szakaszban a szerializáció kapcsán említett személyek listáját leírni.

A SOAP dokumentumba az XML lehetőségeit kiaknázva van lehetőség ilyen bonyolult értékű paraméterértékek leírására is. Ezért a webszolgáltatást alkotó függvények meghívásához ezt kell használni. A tesztweblap, melyen a függvényünket ki tudtuk próbálni, ugyanezen SOAP szerkezetű XML-t készíti el, és küldi be az IIS-nek mint speciális POST-beküldés.

Nem kell aggódnunk: a webszolgáltatás kliens készítésekor meg fogjuk tapasztalni, hogy a SOAP dokumentum elkészítésével és elküldésével igazából nem kell kód szinten foglalkoznunk, ez az információ az, ami a „motorháztető alatt van”.

SOAP-válasz

Az IIS a webszolgáltatás kapcsán egy egyszerű http protokollú postbeküldést tapasztal, mely a webszolgáltatásra mutat. A postba ágyazott elemeket átadja egy belső motornak, amely a SOAP szabványnak megfelelő szerkezetből kiemeli a meghívandó függvény nevét, és deszerializálja a paraméterek értékeit, majd meghívja a függvényt.

A függvény lefut, előállítja a visszatérési értékét, melyet visszaad a motornak. A motor ezt visszacsomagolja egy válasz XML-be (melynek szerkezetét szintén a SOAP szabvány írja le), és átadja az IIS-nek, mintha az egy generált dinamikus html lap lenne. Az IIS (nem érdeklődvén annak tartalma iránt) visszaküldi a kliensnek.

A válasz XML dokumentum szerkezete nagyban hasonlít a beküldéskor ismertetett dokumentum felépítéséhez. A paraméterek helyett azonban az osszeadResult szerepel, mely a függvény visszatérési értékét tartalmazza.

         
<?xml version="1.0" encoding="utf-8"?> 
<soap:Envelope 
   xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
   xmlns:xsd="http://www.w3.org/2001/XMLSchema" 
   xmlns:soap="http://schemas.xmlsoap.org/soap/envelope/"> 
 <soap:Body> 
   <osszeadResponse xmlns="http://tempuri.org/"> 
    <osszeadResult>26</osszeadResult> 
   </osszeadResponse> 
 </soap:Body> 
</soap:Envelope>
          

XML-szerializáció

Ha jól figyeltünk, felismerhetjük, miről is van szó a SOAP kapcsán. A függvény paramétereit ugyanúgy szerializálni kell a meghíváshoz, mint ahogy a függvény visszatérési értékét is. Sajnos a http protokoll nem támogatja a bináris adatforgalmat, mivel a http protokoll igazából nem erre lett kitalálva.

A szerializáció itt nem bináris, hanem XML-szerializáció. A problémái hasonlóak, mint a 9.1. fejezet kapcsán említettek. Az ott ismertetett módszerek (Serializable, Optional, NonSerialized attribútumok, OnDeserialization metódus) az XML-szerializáció kapcsán nem alkalmazhatóak, illetve hasztalanok. Ezek mind a bináris szerializációs és deszerializációs folyamat sajátosságai.

Az XML-szerializáció az alábbi szabályokkal írható le:

  • csak a publikus mezők és propertyk értékeivel foglalkozik,

  • nem tartalmaz típusinformációkat,

  • amely osztályt szerializálni szeretnénk, abban lenni kell alapértelmezett (paraméter nélküli) konstruktornak,

  • a publikus propertyknek írható és olvasható műveletekkel is kell rendelkeznie, a csak olvasható propertyk értéke nem kerül szerializálásra.

XML-szerializáció tesztelése

         
using System.Xml.Serialization; 
using System.Xml; 
 
FileStream file = new FileStream(@"c:\teszt.xml", FileMode.Create); 
XmlSerializer xs = new XmlSerializer ( typeof ( int ) ); 
XmlTextWriter xmlTextWriter = new XmlTextWriter ( file, Encoding.UTF8 ); 
// 
int a = 12; 
xs.Serialize ( xmlTextWriter, a ); 
file.Close();
          

Az eredményül kapott XML fájl az alábbit fogja tartalmazni:

      
<?xml version="1.0" encoding="utf-8"?> 
<int>12</int>
     

A bináris szerializáció kapcsán is kipróbált városok, személyek, házaspárok alkotta lista szerializácója azonban nem fog sikerülni egy komoly probléma miatt: az XML-szerializáció nem támogatja a körkörös hivatkozású adatok szerializációját! Ha még emlékszünk rá, a 9.6. ábrán bemutatott kapcsolatrendszer szerint a házastársak kölcsönösen tartalmazták egymás referenciáit. Ezen példán keresztül mutattuk be, hogy a bináris szerializációnak többek között ilyen jellegű kapcsolatrendszer kezelését is meg kell oldania. Nos, az XML-szerializációnak is meg kellene – de nem tudja. Ez többek között az XML dokumentum képességeire, illetve a SOAP nem alapos kidolgozottságára vezethető vissza. Ezért az eredeti példa (Lajos felesége Gizi, Gizi férje Lajos) XML-szerializációja esetén (egy elég szerencsétlenül semmitmondó) kivétel jelentkezik. A View detail... linkre kattintva deríthető csak fel a tényleges hibaok: A circular reference was detected while serializing an object of type szemely körkörös hivatkozás volt az adatokban.

10.6. ábra. Az keletkezett kivétel

10.7. ábra. A kivétel részletező oka

Ezért megszüntetjük a körkörös hivatkozást az által, hogy Lajos esetén bejelöljük Gizit feleségként, de Gizinél nem adjuk meg Lajost férjként. Ne felejtsük el a varos és szemely osztályokat paraméter nélküli (alapértelmezett) konstruktorokkal bővíteni!

Eredménye az alábbi XML fájl lesz. Ha alaposabban elgondolkodunk ennek adattartalmán, világossá válik egy újabb probléma: a Lajos házastársa Gizi egy komplex adatstruktúra, mely leírja Gizi személyes adatait, születési helyét mint várost, de semmi sem utal arra, hogy ez az adattartalom igazából ugyanaz, mint a később (is) Gizi névvel leírt személy adatai. Tehát míg eredetileg a memóriában volt 3 személy, 2 város példány, addig az xml szerializációt helyreállító kód 4 személy és 4 város példányt fog a memóriába „kicsomagolni”, mivel ő mit sem tud arról, hogy a sok „Eger” város igazából ugyanazon példány.

         
<?xml version="1.0" encoding="utf-8"?> 
<ArrayOfSzemely 
  xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
  xmlns:xsd="http://www.w3.org/2001/XMLSchema"> 
 <szemely> 
   <nev>Lajos</nev> 
   <szul_ev>1970</szul_ev> 
   <ferfi_e>true</ferfi_e> 
   <szuletett> 
    <nev>Eger</nev> 
    <orszagKod>HU</orszagKod> 
   </szuletett> 
   <hazastarsa> 
    <nev>Gizi</nev> 
    <szul_ev>1974</szul_ev> 
    <ferfi_e>false</ferfi_e> 
    <szuletett> 
      <nev>Debrecen</nev> 
      <orszagKod>HU</orszagKod> 
    </szuletett> 
   </hazastarsa> 
 </szemely> 
 <szemely> 
   <nev>Gizi</nev> 
   <szul_ev>1974</szul_ev> 
   <ferfi_e>false</ferfi_e> 
   <szuletett> 
    <nev>Debrecen</nev> 
    <orszagKod>HU</orszagKod> 
   </szuletett> 
 </szemely> 
 <szemely> 
   <nev>Marcsi</nev> 
   <szul_ev>1977</szul_ev> 
   <ferfi_e>false</ferfi_e> 
   <szuletett> 
    <nev>Eger</nev> 
    <orszagKod>HU</orszagKod> 
   </szuletett> 
 </szemely> 
</ArrayOfSzemely>
          

XML-deszerializáció tesztelése

A deszerializáció a fenti problémáktól eltekintve a forráskódban egyszerűen felírható.

      
FileStream file = new FileStream(@"c:\teszt2.xml", FileMode.Open); 
XmlSerializer xs = new XmlSerializer(typeof(List<szemely>)); 
List<szemely> l = (List<szemely>)xs.Deserialize(file); 
file.Close();
     

ISerialization

Az XML-szerializácó egyértelműbb működését érhetjük el, ha a szerializálandó osztályunk implementálja az ISerializable interfészt. Ez egyetlen függvény megírását kéri tőlünk, a GetObjectData metódust, de ugyanúgy feltételez (lényegében igényel) ugyanekkor egy speciális paraméterezésű konstruktort is, melynek pedig a deszerializáció kapcsán lesz majd jelentősége.

      
[Serializable()] 
public class szemely: ISerializable 
{ 
 public string nev; 
 public int szul_ev; 
 
 //Deserialization constructor. 
 public szemely(SerializationInfo info, StreamingContext context) 
 { 
   nev = (string)info.GetValue("neve", typeof(string)); 
   szul_ev = (int)info.GetValue("szuletett", typeof(int)); 
 } 
 
 //Serialization function. 
 public void GetObjectData(SerializationInfo info, 
                     StreamingContext context) 
 { 
   info.AddValue("neve", nev); 
   info.AddValue("szuletett", szul_ev); 
 } 
}
     

A szerializáció ekkor nem a korábban ismertett módon zajlik, nincs semmi automatizmus. A GetObjectData metódusban az info paraméterhez kell név-érték párosokat hozzáadni, melyek ugyanebben a formában kerülnek kiírásra az XML dokumentumba. Tehát amely mezőt (értéket) hozzáadjuk, az belekerül az XML-be, amit nem, az nem kerül bele. Az objektum teljes egészében dönthet tehát saját maga szerializációjáról.

Az ily módon képzett kimenetben az is előfordulhat, hogy egyes mezők értékei nem a C#-beli mezők neveivel, hanem a fejlesztő által választott azonosítókkal. Ez esetben a deszerializáció sem fog működni, de nem is kell. Amikor a visszaolvasás következik, nem az alapértelmezett konstruktort fogja használni a rendszer, hanem a speciális paraméterezésűt. Ekkor ellentétesen eljárva az info listából kiemelve az elemeket, típuskényszerítve visszaállíthatóak az értékek.

A WSDL és a UDDI

WSDL

A 10.5. ábrán korábban láttuk, hogy a webszolgáltatásunkhoz weblap készíthető, mely tartalmazza a szolgáltatás leírását, a függvényeket, a paramétereket, egyéb információkat.

Nagyon fontos lépés, hogy az elkészített webszolgáltatásunk ilyetén információi lekérdezhetőek kell legyenek. A webszolgáltatások ugyanis azért készülnek, hogy más programok használják, meghívhassák függvényeinket. Ezeket a programokat nem feltétlenül a webszolgáltatást nyújtó cég fejleszti. A külső (3rd party) fejlesztőknek hozzá kell tudni férni ezekhez az információkhoz.

Ezeket a leírásokat persze elkészíthetjük PDF formátumú dokumentumban, vagy weblapon is leírhatjuk, de ezzel van egy kis probléma: ekkor ezt a leírást egy embernek kell elolvasnia, értelmeznie, és ez alapján generálnia a kliens oldali kódot (proxy osztályt).

Két legyet ütünk egy csapásra, ha a webszolgáltatásunk leírását egy jóval szervezettebb módon, egy XML dokumentumban készítjük el. Ez nyilván nem a SOAP szerinti felépítésű lesz, mivel az egyetlen függvény meghívását és a visszatérési értékének leírását tárgyalja. A teljes webszolgáltatás leírását egy másik szabvány, a WSDL definiálja. A WSDL a Web Services Description Language tehát szintén egy XML dokumentum. Ha Visual Studióval dolgozunk, akkor a webszolgáltatásunkhoz ezt szintén a Visual Studio generálja le.

A WSDL dokumentáció tehát a webszolgáltatás nyilvános felületét írja le:

  • tartalmazza a webszolgáltatással történő kommunikációról,

  • a protokollkötésekről,

  • és az üzenetformátumokról

szóló információkat, amelyek a függvények használatához szükségesek.

A kliens készítése során látni fogjuk, hogy le kell töltenünk ezt a WSDL dokumentációt, mely alapján a Visual Studio generálni tudja a webszolgáltatás kliens oldali proxyképét, beleértve a függvények neveit, paramétereit, a szerver számítógép elérhetőségét.

A 10.5. ábrán látható url a http://localhost:59455/szamologep.asmx volt. Ezt az url-t kiegészítve http://localhost:59455/szamologep.asmx?WSDL -re a szolgáltatás WSDL leírását kapjuk meg.

         
<?xml version="1.0" encoding="utf-8"?> 
<wsdl:definitions 
   xmlns:soap="http://schemas.xmlsoap.org/wsdl/soap/" 
   xmlns:tm="http://microsoft.com/wsdl/mime/textMatching/" 
   xmlns:soapenc="http://schemas.xmlsoap.org/soap/encoding/" 
   xmlns:mime="http://schemas.xmlsoap.org/wsdl/mime/" 
   xmlns:tns="http://tempuri.org/" 
   xmlns:s="http://www.w3.org/2001/XMLSchema" 
   xmlns:soap12="http://schemas.xmlsoap.org/wsdl/soap12/" 
   xmlns:http="http://schemas.xmlsoap.org/wsdl/http/" 
      targetNamespace="http://tempuri.org/" 
   xmlns:wsdl="http://schemas.xmlsoap.org/wsdl/"> 
 <wsdl:types> 
   <s:schema elementFormDefault="qualified" 
        targetNamespace="http://tempuri.org/"> 
    <s:element name="osszead"> 
      <s:complexType> 
       <s:sequence> 
        <s:element minOccurs="1" maxOccurs="1" name="a" type="s:int"/> 
        <s:element minOccurs="1" maxOccurs="1" name="b" type="s:int"/> 
       </s:sequence> 
      </s:complexType> 
    </s:element> 
    <s:element name="osszeadResponse"> 
      <s:complexType> 
       <s:sequence> 
         <s:element minOccurs="1" maxOccurs="1" 
            name="osszeadResult" type="s:int" /> 
       </s:sequence> 
      </s:complexType> 
    </s:element> 
    <s:element name="osztas"> 
      <s:complexType> 
       <s:sequence> 
        <s:element minOccurs="1" maxOccurs="1" name="a" type="s:int"/> 
        <s:element minOccurs="1" maxOccurs="1" name="b" type="s:int"/> 
       </s:sequence> 
      </s:complexType> 
    </s:element> 
    <s:element name="osztasResponse"> 
      <s:complexType> 
       <s:sequence> 
         <s:element minOccurs="1" maxOccurs="1" 
           name="osztasResult" type="s:int" /> 
       </s:sequence> 
      </s:complexType> 
    </s:element> 
   </s:schema> 
 </wsdl:types> 
 <wsdl:message name="osszeadSoapIn"> 
   <wsdl:part name="parameters" element="tns:osszead" /> 
 </wsdl:message> 
 <wsdl:message name="osszeadSoapOut"> 
   <wsdl:part name="parameters" element="tns:osszeadResponse" /> 
 </wsdl:message> 
 <wsdl:message name="osztasSoapIn"> 
   <wsdl:part name="parameters" element="tns:osztas" /> 
 </wsdl:message> 
 <wsdl:message name="osztasSoapOut"> 
   <wsdl:part name="parameters" element="tns:osztasResponse" /> 
 </wsdl:message> 
 <wsdl:portType name="szamologepSoap"> 
   <wsdl:operation name="osszead"> 
    <wsdl:input message="tns:osszeadSoapIn" /> 
    <wsdl:output message="tns:osszeadSoapOut" /> 
   </wsdl:operation> 
   <wsdl:operation name="osztas"> 
    <wsdl:input message="tns:osztasSoapIn" /> 
    <wsdl:output message="tns:osztasSoapOut" /> 
   </wsdl:operation> 
 </wsdl:portType> 
 <wsdl:binding name="szamologepSoap" type="tns:szamologepSoap"> 
   <soap:binding transport="http://schemas.xmlsoap.org/soap/http" /> 
   <wsdl:operation name="osszead"> 
    <soap:operation soapAction="http://tempuri.org/osszead" 
        style="document" /> 
    <wsdl:input> 
      <soap:body use="literal" /> 
    </wsdl:input> 
    <wsdl:output> 
      <soap:body use="literal" /> 
    </wsdl:output> 
   </wsdl:operation> 
   <wsdl:operation name="osztas"> 
    <soap:operation soapAction="http://tempuri.org/osztas" 
      style="document" /> 
    <wsdl:input> 
      <soap:body use="literal" /> 
    </wsdl:input> 
    <wsdl:output> 
      <soap:body use="literal" /> 
    </wsdl:output> 
   </wsdl:operation> 
 </wsdl:binding> 
 <wsdl:binding name="szamologepSoap12" type="tns:szamologepSoap"> 
   <soap12:binding transport="http://schemas.xmlsoap.org/soap/http" /> 
   <wsdl:operation name="osszead"> 
    <soap12:operation soapAction="http://tempuri.org/osszead" 
        style="document" /> 
    <wsdl:input> 
      <soap12:body use="literal" /> 
    </wsdl:input> 
    <wsdl:output> 
      <soap12:body use="literal" /> 
    </wsdl:output> 
   </wsdl:operation> 
   <wsdl:operation name="osztas"> 
    <soap12:operation soapAction="http://tempuri.org/osztas" 
      style="document" /> 
    <wsdl:input> 
      <soap12:body use="literal" /> 
    </wsdl:input> 
    <wsdl:output> 
      <soap12:body use="literal" /> 
    </wsdl:output> 
   </wsdl:operation> 
 </wsdl:binding> 
 <wsdl:service name="szamologep"> 
   <wsdl:port name="szamologepSoap" binding="tns:szamologepSoap"> 
   <soap:address location="http://localhost:59455/szamologep.asmx" /> 
   </wsdl:port> 
   <wsdl:port name="szamologepSoap12" binding="tns:szamologepSoap12"> 
   <soap12:address location="http://localhost:59455/szamologep.asmx"/> 
   </wsdl:port> 
 </wsdl:service> 
</wsdl:definitions>
          

Lényeges részek a WSDL dokumentumban:

  • a 13. sortól a 49. sorig tartó types szekció, melyben az egyes függvények paramétereinek típusát, a visszatérési értékek típusát írja le;

  • az 50. sortól 61. sorig tartó részben ezek értelmét adja meg, az egyes függvények Soap In (bejövő SOAP üzenet) és Soap Out (válasz SOAP üzenetek) szerkezetét írja le, visszautalva a megfelelő type szekcióra;

  • a 62. sortól a 71. sorig definiálja, hogy a porton, a szolgáltatáson keresztül mely üzenetek forgalmazhatóak (visszautal az előzőleg bemutatott üzenetekre);

  • a 72. sortól kezdve tárgyalja, hogy a szolgáltatás a http protokollon keresztül érhető el, és nem RPC, hanem XML dokumentum alapon;

  • a 118. sortól van az összegzés, mely leírja, hogy mely címen (url) mely módon lehet a szolgáltatás műveleteit elérni, amelyek paramétertípusait és visszatérési értékeit korábban már leírta ugyanezen dokumentum.

Mint láthatjuk, a WSDL leírás a technikai részletekre hagyatkozik, url-ek, műveletek nevei, elérhetőségek, paraméterek, visszatérési értékek, típusok stb. A webszolgáltatásunkhoz ezen leírást nem kötelező, de nagyon ajánlott elkészíteni. Ha rendelkezésre áll, akkor a kliens program készítése lényegesen könnyebbé válik.

UDDI

A WSDL leíráshoz első pillantásra nagyon hasonlónak tűnik a UDDI dokumentum. A UDDI a Universal Description, Discovery and Integration rövidítése. Hasonlóan a WSDL-hez, ezen leírás elkészítése sem kötelező, de nagyon is ajánlott.

A UDDI leírás nem tartalmaz technikai részleteket, inkább magát a szolgáltatást definiálja. Gyakorlatilag azt az információt tartalmazza, hogy a szolgáltatást használók mire számítsanak, milyen tevékenységük elvégzéséhez találnak itt segítséget.

Képzeljük el, hogy szeretnénk a számunkra igen kedves nagy felbontású fotóinkból egy fotóalbumot készíteni. Ehhez nagyon professzionális, nagy felbontású, jó színmélységű lézernyomtatóra lenne szükségünk, hogy kinyomtathassuk azokat. Hogyan keressünk ilyen szolgáltatásokat? A keresők segíthetnek, de ők elsősorban weblapok tartalmában keresnek. Ráadásul igazából nem mi szeretnénk keresni, szeretnénk rábízni ezt a tevékenységet kedvenc képnézegető programunkra, hogy keressen ő nekünk megfelelő nyomtatószolgáltatást.

A képnézegető programunk ekkor UDDI leírásokat kezd el olvasni, megpróbálván találni nekünk egy olyan webszolgáltatást, amellyel képes kommunikálni, amelynek el tudja küldeni a fotóinkat. Program keres programot. A környezetünkben lévő webszolgáltatásoktól bekéri azok leírását, majd felkínálja nekünk, hogy választhassunk.

A UDDI leírásokat szerverek gyűjtik be, hogy könnyebben megtalálhassuk őket. A UDDI célja (a UDDI angol elnevezése alapján) egy univerzális leírás, felfedezés és integrálás rövidítése – egy platformfüggetlen, XML-alapú nyilvántartó rendszeré.

Az UDDI nyílt ipari kezdeményezés, mely lehetővé teszi, hogy a vállalatok megtalálják egymást és meghatározzák segítségével, hogy miként kommunikáljanak az interneten. Ennek megfelelően a UDDI a webszolgáltatások legalapvetőbb komponenseinek egyike.

Kliens írása

A webszolgáltatásban definiált függvények meghívásához készítsünk el egy kliens programot! Ne tévesszen meg minket a webszolgáltatás elnevezés – ez esetünkben csak arra utal, hogy egy webszerverrel kell majd kommunikálnunk http protokollon keresztül. A kliens ettől ugyanúgy lehet akár konzolos felületű, vagy akár windows forms alapú is. Az egyszerűség kedvéért válasszuk most is a konzolos üzemmódot. Az első lépésünk, hogy a Solution Explorerben a References részen az Add Web Reference menüpontot aktiváljuk. Ha 4-es Frameworkkel dolgozunk, akkor ezt a menüpontot Add Service Reference-nek is nevezhetik[34].

Gépeljük be a korábban megismert url-t (esetünkben ez http://localhost:59455/szamologep.asmx), és kattintsunk a kis zöld nyíl gombra! A párbeszédablakba betöltődik ugyanaz a weblap, amit már a böngészőnkben is láthattunk a korábbi tesztelés során. Válasszunk neki saját azonosítót a web reference name részen, majd kattintsunk az Add reference gombra (10.8. ábra)!

10.8. ábra. Webszolgáltatás hozzáadása párbeszédablak

A 4-es Frameworkben programozók számára egy nagyon hasonló párbeszédablak jelenik meg. Ugyanúgy kell eljárni: be kell írni az url-t, a Go gombra kattintva megjelenik a szolgáltatásban definiált függvények leírása. Nevet kell választani (névteret), majd az OK gombra kell kattintani (10.9. ábra). Jegyezzük meg, hogy a 4-es Framework már tartalmazza a WCF-t (amiről hamarosan szó lesz), és a GO gombra kattintás esetén WCF-es proxy osztályt generál kliens oldalra. Ez ugyanúgy működni fog, mint a hagyományos web service proxy osztály, de konfigurálása eltérő. Amennyiben hagyományos web service proxyt szeretnénk kapni kliens oldalon, az „Advanced” gombra, majd az „Add Web Reference” gombra kattintva tudjuk azt elérni. Ezt a lehetőséget tehát egyszerűen eldugták a programozók elől, bízva abban, hogy elkerüli a figyelmet. A 4-es .NET esetén ugyanis a WCF-es megoldások a javasolt módszerek.

10.9. ábra. Webszolgáltatás hozzáadása párbeszédablak

A fenti esetben a végeredmény ugyanaz: a webszolgáltatás WSDL dokumentációjának letöltése után a Visual Studio generál egy proxy osztályt, melyben elhelyezi a webszolgáltatásban definiált függvényeket, ugyanazon névvel, paraméterezéssel. A kliens programban nincs más dolgunk, mint példányosítani az osztályt, és meghívni ezeket a metódusokat.

A webszolgáltatás hozzáadásakor választott név a névtér lesz, melybe a generált proxy osztály kerül. A generált osztály neve a különböző verziójú Frameworkök (és Visual Studiók) esetén eltérő lehet, de könnyű felismerni őket.

         
szamologep_localhost.szamologepSoapClient p = 
 new szamologep_localhost.szamologepSoapClient(); 
int x = p.osszead(12,17); 
Console.WriteLine(x); 
Console.ReadLine();
          

Sessionkezelés

A webservice esetén nincs külön említve, de a webszerverek sajátossága, hogy a klienstől érkező url hatására betöltik a szükséges kódot, hogy az generálja le a választ (html), majd a továbbiakban szükségtelen kódot eldobja. Ezért a webszolgáltatásba ágyazott példány és metódus működése leginkább a singlecall kötésre hasonlít. Ennek elsődleges oka, hogy a HTTP protokoll alapvetően állapotmentes (stateless), vagyis az egyes HTTP üzenetek egymástól, korábbi üzenetektől független tartalommal rendelkeznek, nem szállítanak előző lekérésekből eredő, megmaradó információkat.

A singlecall esetén tudjuk, hogy a szerver oldalon mezőszintű adatok tárolására alkalmatlan. Az RPC kapcsán egy trükköt alkalmaztunk, mely egyedi elérhetőségi url-t képzett egy singleton kötésű példányhoz, de ez webservice esetén nem járható út. Ugyanis a hostolást végző IIS-t kell a futás közben keletkezett újabb URL-ek kezelésére [35] A kliens számára egyedi URL-t kliens oldalon is követni kell, holott mint láttuk a webszolgáltatásunk projekthez adásakor az URL-t rögzítettük. Természetesen ez is megoldható, de webszolgáltatások esetén gyakorlatilag sosem így járunk el, mivel a probléma megoldására van egy hivatalosan támogatott, sokkal egyszerűbb út is.

Helyette az RPC esetén bemutatott session[36] módszert tudjuk alkalmazni. Korábban azért nem mentünk tovább ezen az úton, mert maga a session kezelése igényli egy egyedi azonosító (ID) alkalmazását minden egyes kliens szerver hívás során. Az RPC-be ezt elegánsan nem tudtuk beépíteni, így elvetettük.

A jó hír, hogy a webszerverek, a webszolgáltatások esetén ez a mechanizmus automatikusan tud működni. A kliens az első szerver oldali hívás során kap egy egyedi sessionazonosítót, melyet saját oldalán egy cookie-ban[37] tárol. Ez az azonosító a proxy osztály hívásai során visszaküldésre kerül a webszerverhez. A hagyományos (nem WCF-es) webszolgáltatások esetén a proxy példány CookieContainer mezőjét ki kell tölteni, annak null értéke esetén ugyanis a proxy példány nem kezeli a kliens oldalon a cookie-t, s így a session azonosítót sem.

      
class Program 
{ 
  protected CookieContainer myCookies = new CookieContainer(); 
 
  static public void Main() 
  { 
   szamologep_localhost.szamologepSoapClient p = 
      new szamologep_localhost.szamologepSoapClient(); 
      p.CookieContainer = myCookies; 
      // .... 
  } 
}
     

A webszolgáltatásokat kezelő motor automatikusan kezel egy Session nevű példányt, amely alapvetően HttpSessionState típusú, de számunkra inkább listaszerű (pontosabban dictionary) viselkedésű. Ezen Session listába tudunk értékeket (akár teljes objektumpéldányokat is) elhelyezni. Az egyes értékekre sorszámokkal (egész szám) vagy string azonosítókkal (név) hivatkozhatunk. A Session listába elhelyezett értékek automatikusan mentésre kerülnek a szerver oldalon a sessionazonosítóval együtt. Amikor a kliens által visszaküldött sessionazonosítót a szerver fogadja, visszatölti a hozzá tárolt adatokat ezen Session listába.

A Session listában tárolt adatok tehát „túlélik” a két metódushívás közötti tétlen időt. A példányszintű mezők helyett tehát ide érdemes elhelyezni azokat az adatokat, amiket a klienssel kapcsolatosan szeretnénk tárolni.

A sessionkezelés automatizmusa igazából az ASP.NET sajátja, mely alrendszerbe a webszolgáltatás integrálva van. A webszolgáltatás metódusai akkor részesülnek ebben a szolgáltatásban, ha a WebMethod attribútumot az EnableSession=true paraméterrel kiegészítjük. Amely metódusban ezt elmulasztjuk, ott a Session mező null értékű lesz (nem kerül feltöltésre), így nem használható a feladatához.

         
class Telefon:WebService 
{ 
[WebMethod(EnableSession=true)] 
public bool bejelentkezes(string user, string jelszo) 
{ 
  int felhasznaloSzintje = 
      [ select szint from userek where 
         user=’<user>’ and jelszo=’<jelszo>’ ] 
  Session["fszint"] = felhasznaloSzintje; 
} 
 
[WebMethod(EnableSession=true)] 
string info(string telefonszam) 
{ 
  int felhasznaloSzintje = (int)Session["fszint"]; 
  if (felhasznaloSzintje>=5) 
     return "<reszletes␣informaciok>"; 
  else 
     return "<igen/nem␣info>"; 
} 
}
          

Van még egy probléma, melyet érdemes megemlíteni. Az info metódusban bátran megpróbáljuk kiolvasni az fszint tárolt értéket, és típuskényszeríteni int-re. Tudnunk kell, hogy ha a Session lista olyan elemét kívánjuk kiolvasni, amely nem került korábban kitöltésre, akkor annak értéke null. Márpedig a null értéket nem lehet típuskényszeríteni érték típusra, int-re sem. Ez a fenti kódban előfordulhat, ha a kliens valamiért az info metódust hívja meg elsőként, nem a bejelentkezést. Ez ellen többféleképpen védekezhetünk, de valamelyiket mindenképp alkalmaznunk kell. Egyik megoldás egy egyszerű if -en alapul, de alkalmazhatunk a keletkező NullReferenceException kezeléséhez try ... catch párost is, esetleg választhatjuk az int típus helyett az int? típust is, mely megengedi a null érték jelenlétét a változóban.

      
class Telefon:WebService 
{ 
[WebMethod(EnableSession=true)] 
string info(string telefonszam) 
{ 
  int felhasznaloSzintje = 0; 
  if (Session["fszint"]!=null) 
   felhasznaloSzintje = (int)Session["fszint"]; 
  if (felhasznaloSzintje>=5) 
     return "<reszletes␣informaciok>"; 
  else 
     return "<igen/nem␣info>"; 
} 
}
     

Összefoglalás

A webszolgáltatás lényegében egy, az RPC-hez hasonló technológia. A szolgáltatás definiálása során függvényeket készítünk el, melyek paramétereket fogadhatnak, és melyek értékekkel térhetnek vissza.

Az elkészített szolgáltatást valamely webszerverre bízzuk, ez lesz a host, a szolgáltatást ténylegesen nyújtó számítógép. A webszerver működésének sajátosságai szerint ekkor a szolgáltatást jellemzően a 80-as porton fogjuk megtalálni, és a vele történő kommunikáció során a http protokollt kell használnunk.

A http protokoll miatt ekkor nem bináris, hanem XML-szerializációt kell használnunk a paraméterek átküldése, a visszatérési érték fogadása során. Az XML-szerializáció más jellemzőkkel bír, mint a bináris, más szabályok mentén működik, más megszorításokkal. Ezek közül az egyik legfontosabb, hogy a rekurzív adatszerkezetekkel nem képes együttműködni.

Másik fontos jellemzője, hogy sajnálatosan sokkal lassúbb, mint a bináris működés. Az XML nem csak az adatok string alakra hozását igényli, de az adatok egy hierarchikus dokumentumba helyezését is, melynek szerkezetére is erős megszorítások vonatkoznak. Az függvényhívás paramétereit és a válaszfogadást tartalmazó XML dokumentumok felépítését a SOAP szabvány írja le.

A webszolgáltatást alkotó metódusok működése a singlecall kötéshez hasonló, de a munkamenet- (session-) kezelés erősen támogatott. Emiatt a szerver oldalon klienshez köthető információk tárolása és visszatöltése egyszerűen megoldható.

A webszolgáltatásunkhoz érdemes elkészíteni (generálni) egy WSDL leírást is, mely technikai információkat tartalmaz (függvénynevek, paraméterek, típusok stb.). Ez a WSDL leírás is egy XML dokumentum, mely ugyanarról a webszerverről tölthető le, ahova a webszolgáltatást is elhelyeztük. Ezen WSDL dokumentum alapján a kliens oldali proxy osztály kódja generálható.

A webszolgáltatáshoz ezenfelül érdemes egy UDDI dokumentációt is mellékelni, mely magát a szolgáltatást írja le, s mely alapján a publikus szolgáltatásunkat a felhasználók, a felhasználói programok felderíthetik, megtalálhatják.

A webszolgáltatás legfontosabb előnye a nyitottság. Ez adódik a szabványok használatából (SOAP, WSDL, UDDI), az XML formátum használatából, valamint a http protokoll ismertségéből. Gyakorlatilag minden további nélkül megoldható, hogy egy A programozási nyelven megírt webszolgáltatásban található függvényt egy tőle idegen B programozási nyelven megírt kliens hívjon meg. A kliens oldali proxy osztály kódja ezen a B programozási nyelven kerül generálásra, de a kommunikáció során használt közbülső állomások (SOAP dokumentum, http protokoll) platformfüggetlen módon képes eljuttatni az adatokat a webszolgáltatáshoz, és a tőle érkező választ is vissza a klienshez.



[26] vannak egyéb szkenáriók is, pl. port forwarding, ahol ez kevesebb adminisztrációval jár

[27] CGI modell (Common Gateway Interface)

[28] ez egy GET típusú lekérés, a POST típusúnál a paraméterek és értékek az URL-ben nem látszanak, de ugyanúgy jelen vannak

[29] ezzel nem mint webszerver funkcionalitására célzunk, hanem a lekért oldal előállítási folyamatában történő szerepére

[30] ez ma már kevésbé program, inkább beépülő modul, és valójában az IIS egy speciális feladatú, működésében jól paraméterezhető modulja, az ISAPI.DLL végzi ezt a tevékenységet

[31] a szolgáltatás szót itt „függvények” formában olvasva sokat segít a megértésben. Fogjuk fel úgy, hogy le kell írni a webszolgáltatásunk milyen függvényeket tartalmaz, melyiknek mi a neve, mik a paraméterei, milyen visszatérési értékeket ad vissza stb.

[32] az IIS „nem tudja” mi az a webszolgáltatás, a beérkező XML dokumentumokból az adatok kicsomagolását, és függvény paraméterre való alakítását, a függvény meghívását az ASP.NET motor végzi, mely egy IIS alá települő modul

[33] soap: angolul szappan, de a S.O.A.P. a Simple Object Access Protocol rövidítése

[34] Visual Studio 2010 verzió esetén

[35] az ASP.NET-ben a cookie nélküli böngészők támogatása végett a session azonosítót az URL-be is be lehet csomagolni, de ekkor már van session kezelésünk – mely esetben a problémánk már egyébként is megoldott.

[36] munkamenet

[37] süti

11. fejezet - Communication Foundation

A Microsoft a 3.0 Framework kapcsán jelentette be, hogy a továbbiakban jelentősen szélesíteni szeretné a Framework tartalmi részét. Három új Foundation-t, alapot mutatott be[38]:

  • Windows Presentation Foundation (WPF),

  • Workflow Foundation (WF),

  • Windows Communication Foundation (WCF).

A WCF kutatási előzményét Indigo néven ismerhettük meg. A jegyzet írásakor, 2010-ben a WCF aktuális verziója a 4.0 volt, melynek jellemzőit és működését mutatjuk be az alábbiakban.

A WCF tehát a Framework részeként települő osztály- és szolgáltatásgyűjtemény. Lényegében tartalmaz minden, 2010-ben ipari jelentőséggel bíró kommunikációs protokollt és szabványt, hogy programjaink minél könnyebben és egyszerűbben kommunikálhassanak más programokkal és szolgáltatásokkal. Ekként a WCF az elosztott alkalmazásfejlesztés egyik alapvető eszköze lehet a .NET világában, így a C# programozási nyelven is építhetünk rá.

Vizsgáljuk meg, hogyan képzelhetjük el ezt a világot, melyek azok az alapfogalmak, amelyekre a WCF épít. Meg kell tanulnunk kiaknázni ezt a területet, hogy képesek legyünk jó minőségű elosztott működésű alkalmazások készítésére!

SOA

A WCF egyik legfontosabb alapfogalma a SOA, ami a Service Oriented Architecture rövidítése. Ennek lényege, hogy az alkalmazás olyan önállóan is működő egységekbe van szervezve, melyeknek viselkedésük, működésük jellemzői miatt a szolgáltatás nevet lehet adni.

A szolgáltatások nem mások, mint metódusok, függvények egy csoportja, amelyek valamilyen szempont szerint összetartozó feladatot látnak el. Ezek a függvények idegen fejlesztők által írt programokból kerülnek meghívásra, melyek gyakran csak annyit ismernek a szolgáltatásból, hogy mely adatokat kell átadni a függvényhívás során, és a függvény mit fog kezdeni az adatokkal, mi a függvény feladata, de a megvalósítás menete gyakran nem ismert. A függvény futása során nem kommunikál a felhasználóval, csak a korábbi hívások vagy az aktuális függvényhívás során átadott adatokra támaszkodhat. Ennek megfelelően megvalósítható a felhasználói felület[39] és a működési logika[40] szétválasztása.

Elképzelhető, hogy különböző technológiájú felhasználói felületek kerültek leprogramozásra, pl. Windows Forms, WPF, webes felület, esetleg mobil eszközökre is elkészül valamiféle egyszerűsített platform. Az alkalmazás működési logikája azonban egyetlen gépen kerül csak kidolgozásra, a funkciókat mindenki közösen használja.

Talán nem kell felsorolni az ilyen architektúrák előnyeit, de a legfontosabbakat említsük meg:

  • vonatkozások szétválasztása[41] elvnek megfelelően cél a program felbontása olyan egységekre, amelyek közös funkcionalitása lehető legkisebb, ideálisan nulla.

  • unit tesztelhetőség: az egyes egységek külön tesztelhetőek. A hibakeresés a kisebb programegységben könnyebb, a karbantartása egyszerűbb,

  • a kapott kisebb programegységek (modulok) újrafelhasználhatóvá válhatnak,

  • az alkalmazáslogika telepítése, karbantartása egyszerűsödik,

  • csökken a kliens eszközökre telepítendő kód mennyisége,

  • emiatt a kliens eszközök hardverigénye (memória, processzor) is csökken,

  • az alkalmazáslogika speciális szoftverösszetevőket (pl. adatbázis szerver) igényelhet, az ezekkel kapcsolatos költségek emiatt csökkenthetőek,

  • a szolgáltatás függvényeinek nevei, paraméterezése, a visszatérés típusa és a kommunikációs protokoll ismeretében idegen programozási nyelvekben megírt programok is képesek a szolgáltatás használatára.

Hogy más programozási nyelvekről is kapcsolódhassunk egy WCF szolgáltatáshoz, erre ad lehetőséget a web services kapcsán is bemutatott SOAP szabvány. Az XML-alapú kommunikáció gyakorlatilag bármely programozási nyelven megvalósítható. Tudjuk azonban, hogy az XML-alapú kommunikáció rendkívül sok plusz műveletet igényel, plusz processzoridőt, plusz memóriaigényt. A WCF természetesen támogat más protokollokat, más kommunikációs modelleket is. A szolgáltatás fejlesztésekor dönteni kell, milyen protokollkötéseket adunk meg a függvényeinkhez. Egyszerre többet is megadhatunk, így a kapcsolódó kliensek választhatnak, melyiket használják (11.1. ábra).

11.1. ábra. A WCF szolgáltatás

A klasszikus háromrétegű alkalmazásfelépítésű modell szerint az alkalmazást három fő részre kell osztani:

  • presentation tier (user interface): a felhasználói interakciókat kezeli, tájékoztatja a felhasználót az aktuális folyamatokról, azok előrehaladásáról, állapotáról, lehetőséget biztosít ezen folyamatokba történő beavatkozásra,

  • logic tier (alkalmazói, üzleti logika): a program tényleges tevékenységéhez tartozó kódot tartalmazza, melyben a folyamatok tényleges működése zajlik,

  • data tier (adatréteg): az alkalmazói logika futását támogató réteg, mely az időközben keletkező adatokat tárolja, illetve az aktuális folyamatokat látja el szükséges adatokkal.

A klasszikus alkalmazói programok is ezen rétegződésűek. A III. generációs programozási nyelven írt programok esetén az egyes függvényeket, az OOP modell esetén az egyes objektum-osztályokat kell tudni az egyes rétegekbe – és csakis egy rétegbe – besorolni. A WCF elosztott futást biztosít, de használatával megtarthatjuk az évek során jól bizonyító fejlesztési-felépítési modellt (11.2. ábra).

11.2. ábra. A 3 tier application architecture

A kulcsfontosságú fogalom ez esetben a szolgáltatás definiáltsága. A szolgáltatásunk nem más, mint függvények halmaza. A szolgáltatás definiálása szintaktikai szinten ezen függvények megnevezése, paramétereinek, azok típusainak megadása, a függvények visszatérési típusának definiálása. Ez a tervezés igen korai szakaszában össze kell, hogy álljon, mivel a fejlesztő csapatunk két részre fog szakadni: az egyik csapat a szolgáltatást magát, a másik a felhasználói felületet fogja kialakítani[42]. A szolgáltatás ezen szintű módosítása rendkívül sok extra terhet róhat mindkét csapatra. A módosítást kezdeményezheti bármelyik rész, amennyiben valamely tevékenységük megkönnyítése érdekében ezt kívánatosnak érzik. Ha az indokok elég erősek, és a másik oldal elfogadhatónak véli a vele járó plusz munkát, úgy a változás megtörténhet. De ha ez már a fejlesztési fázison túl lévő projekt, gondolnunk kell a többi, esetleg idegenek által fejlesztett kliensre is: a módosítás az ő működésüket teheti lehetetlenné.

A szolgáltatások a korábbiakban bemutatott módon állapotmentesek (stateless), vagyis a szolgáltatásba tartozó függvények nem tárolnak adatokat a memóriában. Ugyanakkor a webszolgáltatásoknál ismertetett módon kezelnek munkameneteket, melyekbe a szolgáltatások adatokat menthetnek el és tölthetnek vissza. A munkamenet adatait a terheléstől és az adatok mennyiségétől függően akár SQL adatbázisba is menthetjük.

A szolgáltatás szintaktikai definiálását a WCF világában szerződés-nek, contract-nak nevezzük. A kliens, ill. a szerver oldal fejlesztését ennek rögzítésével kezdjük.

Üzenetek forgalmazása

Az elosztott alkalmazások lényege, hogy a kliens kéréseket fogalmaz meg, és ezeket elküldi a szerver felé. A protokoll szerint ezt üzeneteknek nevezzük. Az üzenetekbe a kliens adatokat, függvényhívási paramétereket csomagol be. A szerver oldalon egy ilyen üzenet fogadása nagyon egyszerű, de akár nagyon komplex folyamatot is beindíthat. Ebben a fejezetben röviden ismertetjük, milyen üzenetküldési modellt támogat a WCF. Hogy mely esetben milyen egyéb követelményeknek is kell teljesülniük, később kerül részletezésre.

Kérés-válasz

Ez a legszélesebb körben használható üzenetküldési minta. A kliens valamiféle információt igényel a szervertől. Egyetlen üzenettel elküldi az információkérést azonosító adatokat, a szerver pedig egyetlen üzenetben küldi el a válaszát. A kliens egy meghatározott időintervallumig (timeout) vár a válaszra, utána hibásnak értékeli ki a választ. A válasz akkor is hibásnak minősül, ha az aktuális paraméterek a szerver oldalon kivételt váltanak ki. A kiváltott kivétel részletei nem feltétlenül jutnak el a klienshez, de erről később lesz szó. A kérés-válasz modell tipikusan alkalmazott függvény típusú metódusok meghívásakor. A minta angol neve request-response.

11.3. ábra. Kérés-válasz modell

Tanulmányozzuk 11.4. ábrát! Az üzenetküldés során a kliens az A időpontban küldi el az üzenetet a szervernek, majd várakozni kezd a szerver válaszára, amely a D időpontban érkezik meg. A két időpont között a kliens futása leáll, passzív, inaktív várakozásba lép. A szerver a B időpontban fogadja az üzenetet, futása a C időpontig tart, amikorra is elkészül a számítás eredményével, és visszaküldi azt a kliens felé. A B előtt és a C után a szerver passzívan vár.

11.4. ábra. Kérés-válasz modell idődiagramja

Egyutas

A módszer egyszerűsített kérés-válasz minta. A kliens oldalról csak kérést küldünk el, a bele csomagolt adatokkal együtt. A szerver oldalon ez beindítja a megfelelő folyamatokat, de ezekről a kliens ezen a ponton nem vár visszajelzést. Tipikusan eljárás típusú metódushívás lehetséges ilyen formában. Előnye, hogy a kliens eleve nem is vár választ, nem kell időtúllépést programozni. A hívás emiatt nem hibás, hiszen sem időtúllépés nem következhet be, sem a szerver oldali kivétel kiváltásáról nem kapunk visszajelzést. A minta angol neve one-way.

Az egyutas mód az aszinkron működés egyik eszköze. A kliens folytathatja a saját oldali tevékenységeit. A kommunikáció nagyon gyors, a kliens szinte azonnal, zökkenőmentesen képes folytatni a felhasználóval a kommunikációt.

A kliens a küldéshez választhat olyan protokollt is, amelynek használatakor nem garantált a kézbesítés (pl. UDP), illetve a késleltetett kézbesítéses módszereket is alkalmazhatja (pl. MSMQ). Az előbbit alkalmazhatjuk akkor, ha a kliens nagy sebességű üzenetküldésekkel egyfajta állapotinformációkat küld, melyekből néhány elmaradása nem tűnik problémának, mivel a következő üzenet értelmezése egyben az előző feleslegessé válását, elavultságát is jelenti. Az MSMQ pedig egy nagyméretű üzenettároló technika (Message Queue), mely akkor is képes üzeneteket fogadni, ha a szolgáltatás épp üzemen kívüli (offline). A szolgáltatás indulásakor az MSMQ időrendben haladva átadja az üzeneteket, melyek feldolgozásával a szolgáltatás pótolhatja a kiesett időt.

11.5. ábra. Egyutas modell

Az egyutas modell idődiagramja a 11.6. ábrán látható. A kliens az A időpontban küldi el a szerver felé az üzenetét, de utána ugyanúgy folytatja a működését mint korábban. A szerver a B időpontban fogadja az üzenetet, a benne aktiválódó folyamat a C időpontig fut. A C időpontról, a befejeződésről azonban a kliens semmit sem tud, számára nem fontos, lényegtelen.

11.6. ábra. Egyutas modell idődiagramja

Duplex

A forgalmazás ebben az esetben (is) azzal kezdődik, hogy a kliens elküldi a szervernek a folyamat elkezdését kérő üzenetet, paramétereiben definiálva a részleteket, valamint megadja egy, a saját (kliens) kódjában szereplő függvény elérhetőségét. A szervernek lehetősége van a kliens ezen függvényét meghívni, amennyiben további adatokra van szüksége, olyan adatokra, melyeket csak ezen kliens oldali függvény képes számára megadni (pl. mert a kliens számítógépen lévő fájlból kell azokat kiolvasni stb.) A másik lehetséges ok, amiért a szerver ezen kliens oldali függvényt meghívja, hogy ilyen módon tájékoztatja a klienst a folyamat aktuális állapotáról, a folyamat előrehaladásáról. Ezt a kliens oldali függvényt callback függvénynek nevezzük.

A callback technika a professzionális programozók egyik gyakran és előszeretettel alkalmazott eszköze. A callback ez esetben visszahívásnak fordítható.

Az üzenetküldési minta fontos eleme, hogy a kliens eredeti (folyamatindító) üzenetére a szervernek a végén választ kell küldenie (mintha ez egy kérés-válasz típusú üzenet lenne). A kliens eredeti folyamatindítása ezen válaszüzenet megérkezéséig blokkolódik, várakozik. A callback függvénye tehát mindenképpen külön szálon fut le, mely idő alatt a kliens fő szála sleep állapotban várakozik a szerverre.

A callback függvény szignatúráját a szerver oldalon, a szolgáltatás definiálásakor kell megadni. Ezt úgy kell értelmezni, hogy a szerver elvárja a klienstől az adott paraméterezésű és visszatérési értékű függvény létezését a kliens oldalon. Ennek pontos nevét, elérhetőségét kell a duplex kezdeti üzenetében átadni.

11.7. ábra. Duplex modell

A duplex modell idődiagramja (11.8. ábra) azt mutatja, hogy a kliens fő szála a fő kommunikációs részen, az A és D időpontok között passzív. Ezek a duplex minta keretüzenetei. A két időpont között a szerver saját akarata szerint aktiválhatja a kliens kódjában a callback függvényt, melyet a második szál mutat. A kliens program tehát egy második szálon aktív, a t1 és t2, a t5 és t6 időpontok között. Ha a szerver ezeket a callback hívásokat a kérés-válasz modell szerint küldi, akkor a küldés t0 és a válasz fogadása t3 között a szerver is inaktív. A szerver a duplex minta válaszüzenetét a C időpontban generálja, mely után lényegében a szerver leáll. A válaszüzenetet a kliens fő szála a D időpillanatban fogadja, így a futása folytatódhat.

11.8. ábra. Duplex modell idődiagramja

A duplex hívás időtartama alatt az eredeti szerver-kliens szerepkör megfordul, a szerver aktivál szálindulást a kliens oldalán. Ezen mozzanat miatt is fontos a WCF használata, hiszen így a szerverek viselkedési kódját is le kell programozni a kliens oldalon. A WCF ebben sokat segíthet, leveheti a munka oroszlánrészét a vállunkról.

Streaming

Ezt a mintát akkor alkalmazhatjuk, ha a kliens a szervertől rendkívül nagy mennyiségű adatot igényel. Ez olyan nagy mennyiség, hogy egyben értelmetlen lekérni és megkapni. Ennek oka lehet, hogy a kliens oldalon nem is feltétlenül szükséges a teljes adatmennyiség, illetve hogy a kliensnek is időre van szüksége az adatok fogadására és tárolására (pl. mert a kliens eszköz alapvetően gyenge hardverfelszereltségű). De ugyanez a helyzet áll fenn, amikor a szervertől egy videót fogad a kliens, és a program kezelője dönti el, a videó melyik részét kívánja megtekinteni.

A szervertől igényelt nagy mennyiségű adatot darabokra[43] kell bontani, és biztosítani kell a lehetőséget, hogy a kliens a saját tempójában tudja ezeket a darabokat letölteni és feldolgozni.

A darabok letöltése során a sorrendet meg kell tartani. A szerver feladata, hogy az utolsó darab áttöltése után jelezze az adatfolyam végét.

11.9. ábra. Streaming modell

Pub-sub

A minta olyan esetben használható, amikor van egy kliensünk, mely rendszeres vagy rendszertelen időközönként adatokat állít elő, melyeket meg kíván másokkal is osztani, de a klienst futtató számítógép nem alkalmas erre, pl. nincs állandó netkapcsolata, vagy nem képes nagy mennyiségű klienssel kommunikálni egy időben. Ekkor a kliens a megosztani kívánt adatokat átküldi egy szerverhez.

A szerver egy feliratkozási (subscribe) listát kezel, melyre tetszőleges (idegen) kliens iratkozhat fel. Amikor új adat érkezik a publikálótól, a szerver a feliratkozott klienseket értesíti egy callback függvény meghívásán keresztül.

Fejlett megvalósítás esetén a feliratkozáskor egy szűrőt (filter) is átküldhet, melyet a szerver alkalmaz, és ami segítségével el lehet kerülni, hogy egyes klienseket feleslegesen „zaklasson”.

A WCF 4.0 nem támogatja ezt az üzenetküldési mechanizmust, de az egyéb üzenetküldési minták segítségével a működés elérhető.

11.10. ábra. Pub-sub modell

Adott sorrendű hívás

A szerver szolgáltatásaiban több függvény is szerepel, de ezek csak adott sorrendben hívhatóak meg. A függvények esetén meg lehet adni olyan szabályt, hogy mely más függvények sikeres meghívása szükséges, hogy megelőzzük az adott függvényhívást. Ezenfelül definiálhatunk egy lezáró függvényhívást is, melynek hívása után további hívásokat már nem hajthatunk végre.

E a szemlélet elég gyakori a programozás során. Az objektumok első lépése mindig a konstruktor hívása, csak később hívhatjuk meg a műveleteit, de a destruktor után már semmilyen műveletet nem hajtjatunk végre. A fájlokkal való műveletvégzés első lépése mindig a megnyitás kell, hogy legyen, csak utána tudunk olvasni a fájlból, de a fájl bezárása után már nem szabad tovább olvasni stb.

A WCF részlegesen támogatja ezt a működést, mivel minden függvény esetén megadhatjuk, hogy ő IsInitiating jellegű-e. Ezek előtt a függvények előtt más függvények hívására nincs mód. Ezenfelül lehetőség van IsTerminating megadására is. Az ilyen függvények után már más függvényeket nem lehet meghívni.

A WCF esetén az alapbeállítás szerint minden függvény inicializálós, egyik sem terminálós típusú. Vagyis bármelyik függvényt meg szabad elsőként hívni, és egyik sem tiltja meg a további hívásokat.

A sorrendiség azt is jelenti, hogy a sorrendet nemcsak a szerver, de a kliens is ismeri, mivel ez része a szerződésnek, a szolgáltatás leírásának. Vagyis a kliens oldali proxypéldány önállóan dönthet nem megfelelő sorrendű hívások megtagadásáról.

11.11. ábra. Adott sorrendű hívási modell

A WCF felépítése

A WCF esetén hasonló felépítésre lehet számítani, mint amit az RPC esetén már bemutattunk. A kliens programban egy proxy osztály generálódik, amely minden tekintetben úgy viselkedik a kliens program egyéb osztályaival szemben, mintha ő egy igazából kész, működőképes osztály lenne. A különbség az, hogy metódusainak meghívása esetén egy üzenetet hoz létre, melybe becsomagolja a paraméterül kapott értékeket, majd elküldi őket a távoli szerver felé a hálózaton keresztül. Megvárja, míg a szerver a választ előállítja, fogadja a visszatérő üzenetet, kicsomagolja és helyreállítja az adatokat a kliens számítógép memóriájában, és a továbbiakban úgy viselkedik, mintha az eredmények az ő saját számításai alapján készültek volna el. Emiatt a proxy osztály ezen működése a kliens program további részei által felfedezhetetlen, ún. átlátszó. Egy jól megírt proxy osztályt lehetetlen megkülönböztetni egy valódi, helyben számításokat végző osztálytól.

11.12. ábra. A WCF felépítése

Manapság egy új fogalom jelent meg ezen a területen: a szolgáltatásbusz[44]. A szolgáltatásbuszt úgy lehet elképzelni, mintha a proxy nem egy jól kiválasztott és azonosított szerverrel állna kapcsolatban, hanem csak egy csatornával. A proxy az üzenetet beküldi erre a csatornára, amely egyenesen egy irányító, elosztó szerepkörű szerverhez vezet. Ezen szerver elolvassa az üzenetet, megpróbálja megérteni, milyen szolgáltatást (függvényhívást) igényelnek tőle. Több olyan szolgáltató (szerver) is feliratkozhat ezen irányítónál, aki képes ezen függvényhívást kezelni, a választ generálni. Az irányító választ egyet (az üzenet jellegétől függően akár többet is), és továbbítja számukra az üzenetet. A szerverek válaszát visszaküldi a proxy szervernek.

Ekképpen jól kezelhető több olyan karbantartási és verziófrissítési eset, mely egyébként az elosztott működésű programok életét keseríti meg.

További új fogalom a tartalombővítő[45], mely egy olyan közbeeső állomás, amely az eredeti üzenetbe tárolt adatokon végez módosítást. Példa lehet erre a szolgáltatásra, hogy az eredeti függvényhívás adatait adatbázisból kell kiegészíteni, lekérdezni, de az üzenetet küldő kliensnek nincs adatbázis-hozzáférése. A tartalombővítő elveszi az üzenetbe befoglalt SQL-lekérdezéseket, végrehajtja őket, a kapott adatokat pedig visszahelyezi az üzenetbe. Mire az üzenet eléri a célszervert, addigra már a ténylegesen feldolgozható adatok szerepelnek benne.

A tartalombővítő természetesen ennél jóval általánosabb funkciókat is elláthat, akár az üzleti logika részét képező átalakításokat is elvégezhet az üzeneteken. Emiatt a tartalombővítő szintén segítséget adhat az egyes szolgáltatásverziókra átállás esetén, ahol egy – eredetileg más verzióra megírt – kliens üzeneteit kell átalakítani az új verzió eseteire.

Szintén jelen lévő szolgáltatás lehet az üzenet forgalomirányítása[46]. Ez a szolgáltatás az eredeti üzenetben célként megjelölt szerver címét irányíthatja át más szerverek felé anélkül, hogy a kliens ezt érzékelné. Itt gondolhatunk hacker működésre is, de terheléselosztási, karbantartási, verziókövetési teendők esetén a forgalomirányítás segíthet a szolgáltatásokat igénybe vevő kliensek zökkenőmentes működtetésében.

A forgalomirányítás részeként protokollátalakítás[47] is történhet, ha a kiválasztott szerver az eredeti üzenetformátumot, vagy alkalmazott protokollt nem ismeri.

A fenti szolgáltatások működtetése, konfigurálása során az üzenetszűrőket[48] használjuk. Ezek az XML-alapú SOAP-üzenetek esetén olyan XPath kifejezések, melyeket a SOAP-üzenetek belsejében alkalmazunk, de jellemzően nem az üzenetek adattartalmára, hanem az üzenet szerkezetére vonatkoznak. Ezek segítségével lehet az egyes SOAP üzeneteket megkülönböztetni egymástól, és tartalombővítő, forgalomirányító teendőket választani hozzájuk.

„C” – A szerződés

Korábban már többször is szóba került a szerződés, contract fogalma. A szerződés a hívható függvények neveit, paraméterezését, a paraméterek típusát írja le.

Különbséget kell tenni a kóddal, szolgáltatással kapcsolatos szerződés (service contract), és a paraméterek, a típusok leírásával kapcsolatos szerződés (data contract), valamint az üzenetek felépítésével és tartalmával kapcsolatos szerződés (message contract) között.

Azért nevezzük ezt szerződés-nek, mert tartalma mindkét fél által ismert, és mindkét fél el kell, hogy fogadja, különben nem jöhet létre a két fél közötti kommunikáció.

Szerver oldali szerződés

Tételezzük fel, hogy egy autókölcsönző szolgáltatást akarunk készíteni! A szolgáltatásunk egyik része, hogy egy függvényt kínálunk fel, mely képes kiszámítani adott hosszúságú bérlés esetén a bérleti árat. Nyilvánvaló, hogy az üzleti logika szerint hosszabb bérlés árkedvezményekkel járhat, melyet ez a függvény képes lehet figyelembe venni. Az egyes autótípusokra időszakos akciókat is hirdethetünk stb. Érdemes tehát egy ilyen, a szolgáltató szerverén futó szolgáltatásként meghirdetni ezt a funkciót, s nem az egyes telephelyek klienseire bízni ennek a gyakran változó belső tartalmú függvénynek a működtetését.

         
// using System.ServiceModel; 
 
[ServiceContract()] 
public interface IAutoKolcsonzo 
{ 
 [OperationContract] 
 double CalculatePrice(DateTime kezdoDatum, 
         DateTime zaroDatum, string autoTipus); 
}
         
                                                                                                                                               

                                                                                                                                               
    

Mint látjuk, interfészben hozzuk létre a funkciók listáját. A teljes interfészt a ServiceContract attribútummal annotáljuk, míg az egyes műveleteket, metódusokat az OperationContract-al.

A ServiceContract nélküli osztályok, interfészek nem kerülnek be a szerver szolgáltatási listára. Hasonlóan, az OperationContract nélküli függvények nem hívhatóak meg kívülről. Ezek egyrészt biztonsági beállítások, másrészt a WCF motor működését befolyásoló dolgok.

A WCF motor a kliensek csatlakozási kísérletekor üzenetekkel tájékoztatja a klienst a szerver aktuális, publikus szerződéseiről. Az üzenetek szabványosak, SOAP-alapú XML dokumentumok. A kliens oldali WCF motor ezt a részt automatikusan kezelni fogja, ez része a háttérműködésnek. De fontos, hogy megértsük: az osztályra és a műveletekre vonatkozó attribútumok nélkül ezek nem kerülnek bele, nem fogják részét képezni ezen egyeztetési folyamatnak. A szerver oldali szerződések egy WSDL dokumentumba kerülnek be, melyet normális esetben egy WSDL-generáló eszközzel (pl. Visual Studio) készítünk el.

Amennyiben a szolgáltatási és a műveleti szerződést az interfész szintjén adjuk meg, ugyanezen szerződés ki fog terjedni az interfészt implementáló osztályokra is.

Kliens oldali proxy

A kliens oldali fejlesztés a szerver oldali szerződések (WSDL dokumentum) letöltésével kezdődik. A dokumentumot érdemes egy eszköznek átadni, mely képes a kliens oldali proxy kódját előállítani. Ilyen eszköz lehet a Visual Studio, illetve a Windows SDK részét képező svcutil.exe program is. Az eljárás szinte teljesen megegyezik a Web Service fejezetben leírt metodikával.

ServiceContract részletezése

A ServiceContract egy összetett attribútum. Leggyakrabban további beállítások nélkül alkalmazzuk, de van lehetőségünk befolyásolni a generált WSDL dokumentumban szereplő beállításokat, melyeket a WCF motorja is felismer és képes kezelni.

  • CallbackContract (type): egy interfésztípust szokás megadni, mely a duplex üzenetek esetén a visszahívások során felhasználható függvényeket tartalmazza.

  • ConfigurationName (string): a szolgáltatás névterét lehet megadni, melyre az alkalmazáskonfigurációs fájlban hivatkozhatunk.

  • HasProtectionLevel (bool): beállíthatjuk, hogy a metódusoknak van-e védelmi szintjük vagy sem.

  • Name (string): a WSDL dokumentbeli portType beállítás nevének konkrét értéke.

  • Namespace (string): a WSDL dokumentbeli portType beállítás névterének konkrét értéke.

  • ProtectionLevel (ProtectionLevel enum): a titkosítási szint értéke, [None,Sign, EncryptAndSign] értékekre lehet állítani.

  • SessionMode (SessionMode enum): beállítja, hogy a működés munkamenet- (session) kezelést igényel-e vagy sem, [Allowed, Required, NotAllowed] értékű lehet.

Az alábbi példa mutatja be a további beállítások használatának módját:

         
[ServiceContract( SessionMode=SessionMode.Allowed, 
 ConfigurationName="AutoKolcsonzo" )] 
public interface IAutoKolcsonzo 
{ 
... 
}
          

OperationContract részletezése

A műveleti szerződés is egy összetett attribútum, melynek további beállítási lehetőségei az alábbiak:

  • Action (string): lényegében a metódus, a művelet neve, amelynek segítségével az irányító[49] képes eldönteni, melyik üzenet melyik metódushívásnak felel meg.

  • AsyncPattern (bool): azt jelöli, hogy a művelet meghívható-e aszinkron módon, felhasználván (generálván) a begin/end párost.

  • HasProtectionLevel (bool): jelzi, hogy a protection level értéke beállításra került-e vagy sem.

  • IsOneWay (bool): jelzi, hogy a művelet hívása az egyutas módszerrel működjön-e vagy sem.

  • IsInitiating (bool): sorrendi hívás esetén ez kezdő hívás-e vagy sem.

  • IsTerminating (bool): sorrendi hívás esetén ez befejező hívás-e vagy sem. Amennyiben kértünk sessionkezelést, ez egyúttal a session megszüntetését is jelöli.

  • ProtectionLevel (ProtectionLevel enum): a metódus hívási védelmi környezetét definiálja, [None,Sign, EncryptAndSign] értékekre lehet állítani.

Adatszerződés

A korábbi fejezetek tárgyalták már a szerializációval kapcsolatos problémákat. A WCF kapcsán speciális szerializáló került kifejlesztésre, a DataContractSerializer. Amennyiben valamiért ez nem felel meg a céljainknak, a DataContract attribútum beállításaival jelölhetünk ki mást, akár a korábban ismertetett „hagyományos” XmlSerializert.

A DataContractSerializer képes szerializálni:

  • alaptípusokat (int, double, DateTime, string stb.),

  • DataContract attribútiummal megjelölt típusokat,

  • azon osztályokat, amelyek serializable módon meg vannak jelölve,

  • azon osztályokat, melyek implementálják az IXmlSerializable interfészt,

  • enumerációkat (enum), gyűjteményeket (collections) és generikus kollekciókat.

Egyéb esetekben szükséges, hogy a saját adattípusainkat ellássuk adatszerződéssel. Tételezzük fel, hogy az autókölcsönzés kapcsán saját osztályt definiálunk, amely leírja a kölcsönzéssel kapcsolatos igényeinket!

         
// using System.Runtime.Serialization; 
 
[DataContract] 
public class PriceCalculationRequest 
{ 
      [DataMember] 
      public DateTime kezdoDatum { get; set; } 
      [DataMember] 
      public DateTime zaroDatum { get; set; } 
      [DataMember] 
      public string visszaadasiHely { get; set; } 
      public string szin { get; set; } 
}
          

Vegyük észre, hogy a „szin” propertyhez nem rendeltük hozzá a DataMember attribútumot! Ennek megfelelően nem kerül majd szerializálásra (amely persze probléma is lehet). Más módon is megközelíthetjük ezt a dolgot.

      
// using System.Runtime.Serialization; 
 
public class PriceCalculationRequest 
{ 
      public DateTime kezdoDatum { get; set; } 
      public DateTime zaroDatum { get; set; } 
      public string visszaadasiHely { get; set; } 
      [IgnoreDataMember] 
      public string szin { get; set; } 
}
     

Az utóbbi esetben fordítva gondolkodunk. A publikus osztályokat a data contract megjelölés nélkül is megpróbálja a rendszer szerializálni, ekkor a publikus mezők és propertyk kerülnek feldolgozásra. A kivételt úgy adhatjuk meg, hogy azok a mezők, melyek tartalmát nem kívánjuk, hogy szerializálásra kerüljenek – megjelöljük IgnoreDataMemer attribútummal.

A DataContract és a DataMember attribútumok

A DataContract attribútum a legtöbb esetben különösebb finomítások nélkül is megfelelő lehet, de van lehetőség néhány alapértelmezett beállítás módosítására.

  • Name (string): a szerializálás során a különböző név használata,

  • Namespace (string): a szerializálás során más névtér használata,

  • IsReference (bool): referencia szerinti szerializálás.

Az XML-szerializáció kapcsán említettük, hogy körkörös hivatkozások kezelésére nem képes. A WCF is SOAP-alapú XML-szerializációt végez, így a problémák hasonlóak. A 3.5-ös Framework egyik újdonsága az IsReference attribútum, melynek segítségével a típusunkat megjelölhetjük mint referenciatípust. Ekkor a szerializálás során IDREF segítségével megjelöli és azonosítja a példányokat a folyamat, így lehetőség van a körkörös hivatkozású (kört tartalmazó gráf) szerializálására, és deszerializálására is.

A DataMember attribútummal az egyes adattagokat (mezők, propertyk) jelölhetjük ki szerializálásra.

  • EmitDefaultValue (bool): azt jelöli ki, hogy ha a mező értéke a szerializáláskor még mindig a típusának alapértéke, akkor is bele kell-e venni a szerializálásba vagy sem.

  • IsRequired (bool): jelzi, hogy az érték hiányában biztosan nem lehet sikeres a deszerializáció.

  • Name (string): az érték XML-ben használt neve. Order (int): a szerializálás során a sorrendiséget befolyásolja.

Verziókövetés

Tudomásul kell venni, hogy bár a tervezés lehet alapos, az idő mégis arra kényszeríti a fejlesztőket, hogy módosításokat végezzenek a szolgáltatáson. Ez érintheti a ServiceContractot éppúgy, mint a DataContractokat.

Logikusnak tűnik, hogy bizonyos módosítások mellett a kliensek a régi szerződés ismeretében is képesek maradnak az új szolgáltatás használatára. Ilyen lehet például, ha új metódus jelenik meg a kód szintű szerződésben, de ezen metódus nem különleges például olyan szempontból, hogy kezdő (initial) metódus lesz, miközben eddig ilyen nem volt.

Hasonlóan nem okoz problémát új mezők felbukkanása a DataContractban, amíg azok nem megkövetelt (required) mezők, és alapértelmezett értékük mellett elvégezhető a deszerialiazálás (opcionális mező). Az sem okoz feltétlenül gondot, ha egyszerűen eldobunk egy korábban létező mezőt, amennyiben az a túloldalon nincs megkövetelve.

Üzenetszerződés

Ahogy korábban említettük, a WCF alapvetően SOAP-üzenetekkel kommunikál. Az üzenetbe a service és data contractoknak megfelelő XML-darabkák kerülnek be, melyek együtt adják ki a teljes SOAP-üzenetet. Attribútumokkal jelentősen tudjuk ezen SOAP-üzenet szerkezetét, felépítését befolyásolni, de vannak esetek, mikor ennél többet szeretnénk.

Az üzenetszerződések (message contract) segítségével a teljes SOAP üzenet feletti ellenőrzést átvehetjük, könnyen bővítve azt új mezőkkel.

„B” – kötések

A szolgáltatások és az adatok leírása a szerződések kapcsán nyilván fontos lépés, de önmagában nem elégséges a működéshez. A korábbiakból tudjuk: mindig kell egy portot is nyitni, amelyen keresztül a kliensek csatlakozni tudnak a szolgáltatáshoz. Azt is megértettük, hogy a két oldalnak ismernie kell azt is, melyek a kulcsszavak, mi a protokoll, amelyen keresztül megérthetjük egymás üzeneteit.

A WCF világában a protokollra vonatkozó szabályokat kötésnek (binding) nevezzük. A kötés a cím + kötés + szerződés hármas középső eleme. Angolul ezeket ABC (address + binding + contract) hármasnak nevezik, és egyben (szintén angolul) a WHW (where + how + what – hol + hogyan + mit) hármast is alkotják.

A kötés definiálja az alábbiakat:

  • az átviteli protokollt, pl. http vagy tcp,

  • a kódolást (bináris, egyszerű text fájl, xml stb.),

  • egyéb beállítások, mint pl. a titkosítás.

A WCF több előre definiált kötést ismer, melyek szabványos elemekből épülnek fel. Emiatt mind a szerver, mind a kliens oldalon alkalmasak az építkezésre. Ugyanakkor a WCF biztosít lehetőséget saját kötések felépítésére, melyek nem csak azt jelentik, hogy a meglévő elemekből más sorrendben hozzunk létre új szerkezetű kötéseket, vagy saját komponensek fejlesztésével tegyük még egyedibbé a valamely kötést.

A kötés a hálózatokban is ismert protokollpohárhoz hasonló működésű. Vagyis komponensek egy sorozata alkotja. A komponensek legelső eleme fogadja a küldendő adatsorozatot elsőként. Az általa átalakított, generált outputot a következő komponens kapja, amíg végig nem megy az adatsor a „futószalagon”. Ezt nevezzük csatorna-veremnek[50].

A továbbiakban röviden bemutatjuk azokat a szabványos működésű, elterjedt kötéseket, melyek használata a WCF esetén a legegyszerűbb. Mint említettük, van lehetőség ezektől eltérő kötéseket is készíteni, akár saját komponensekkel is bővítve az elemeket, de ez akadály lehet, megnehezíti a szolgáltatásunkhoz való csatlakozásokat.

A szabványos kötések:

  • BasicHttpBinding

  • WebHttpBinding

  • wsHttpBinding

  • wsDualHttpBinding

  • wsFederationHttpBinding

  • netTcpBinding

  • netNamedPipeBinding

  • netPeerTcpBinding

  • netMsmqBinding

  • msmqIntegrationBinding

BasicHttpBinding

Ez a hagyományos (ASMX) webszolgáltatások protokollja. Alapvetően HTTP protokoll alapú, az üzeneteket UTF-8 kódlap segítségével kódolja. A HTTP csomagokba ágyazott SOAP üzenetekkel kommunikál. Jellemzően a 80-as portot haszálja, leginkább .NET-ben készült webszolgáltatások eléréséhez használjuk.

WebHttpBinding

Ez a REST[51]-alapú szolgáltatások protokollja, melyek XML vagy JSON kimenetet produkálnak, s emiatt jól használhatóak webes felületű klienseknél, elsősorban AJAX hívásokkal teli környezetekben. Jellemzően paraméterek nélküli (vagy a GET hívásba építettek a paraméterek), vagyis az adott url-től egyszerűen adatokat fogunk kapni, különösebb SOAP-mechanizmusok nélkül.

wsHttpBinding

A „ws” előtaggal kezdődő kötések az alapkötések kiterjesztései, kiegészítve őket új tulajdonságokkal, pl. szélesebb körből választható titkosítások alkalmazhatóak. A wsHttpBinding az alap HttpBinding kötés fejlettebb változata.

wsDualHttpBinding

Ez az előző (wsHttpBinding) kötés fejlesztése, hogy képes legyen duplex üzenetküldési minta használatára is, vagyis mind a kliens, mind a szerver képes üzenetek küldésére és fogadására.

wsFederationHttpBinding

A „federated identity” néven ismert technológiák a külső rendszerekre is kiterjedő integrált azonosságkezelést biztosítanak. Ezen kötés lehetőséget biztosít a webszolgáltotásoknak, hogy „federated identity” azonosítással és hitelesítéssel ellátott üzeneteket küldjenek és fogadjanak.

netTcpBinding

Ez a kötés TCP-alapú bináris kommunikációt jelent. Ezt akkor alkalmazhatjuk, ha két olyan programot kapcsolunk össze, amelyek mindegyike .NET Framework alapú, és WCF-et képes használni a kommunikáció során. A kommunikáció folyamán tranzakciókezelés és titkosítás is alkalmazható.

netNamedPipeBinding

Ugyanazon számítógépen belüli (folyamatok közöti, inter-process) kommunikáció, ez esetben a kliens és a szerver is egyazon operációs rendszer felügyelete alatt fut, egy memóriahídon, egy csővezetéken keresztül kommunikálhatnak.

netPeerTcpBinding

Ez a peer-to-peer alapú hálózatok esetén használható kommunikáció. Bár ez esetben is TCP a szállítási protokoll, a P2P hálózatokon különböző a névfeloldási módszer (esetünkben a PNRP[52]). A P2P hálózatokat alkalmaznak a fájlmegosztók is, mint pl. a torrentek is.

netMsmqBinding

Az MSMQ[53] szolgáltatást használó alkalmazások protokollja, mely esetben mind az üzenetet a várakozási sorba elhelyező, mind azt feldolgozó alkalmazás .NET Framework környezet alkalmazásával íródott.

msmqIntegrationBinding

Ez a protokoll akkor alkalmazható, ha az MSMQ-t használó alkalmazások valamelyike nem .NET Framework alapú.

Viselkedés

A szolgáltatás bizonyos beállításait a szolgáltatás viselkedésén (behavior) tudjuk finomhangolni. Ezek részét képezik az attribútumokon keresztül történő beállítások; némelyiket kódból is be tudjuk állítani, és sok beállítást konfigurációs fájlban (app.config) is meg tudunk tenni.

Szolgáltatásszintű viselkedés

A szolgáltatásszintű beállításokat a ServiceBehaviour attribútumon keresztül tudjuk módosítani. A legfontosabb beállítások az alábbiak:

InstanceContextMode: ezzel a beállítással a szolgáltatáspéldányunk élettartamát tudjuk beállítani. A PerSession – amelyre az RPC kapcsán nagyon vágytunk volna – minden bejövő kliens kapcsolathoz ugyanazon példányt használja. A PerCall lényegében a singlecall, a Single a singleton hívási modellű viselkedést adja meg.

ConcurrencyMode: három értéke lehet, single, reentrant vagy multiple. Az első esetben a szolgáltatásunk csak egy szálon futhat, amennyiben már fut egy bejövő hívás, új üzenet esetén várakoztatni fogja a WCF motor. A másik két beállítás esetén egy időben több függvényhívás is futhat külön szálakon, tehát a függvényeknek erre ügyelniük kell, szükség esetén alkalmazni a lock utasítást vagy a Monitor osztály különböző metódusait. A reentrant elsősorban a duplex üzenetküldéssel kapcsolatos viselkedés. Ezen beállítás csak a InstanceContextMode beállítással párban értelmezhető!

IncludeExceptionDetailInFaults: a kezeletlen hibákat alapértelmezetten SOAP fault kivételként adja vissza a rendszer. Ez a szolgáltatás belső működésének egyfajta védelme. Engedélyezéséhez ezt az attribútumot állítsuk true értékre! Ekkor a kezeletlen kivételek eredeti formájukban jelentkeznek a kliensben, de ekkor nagyméretű visszatérő SOAP-üzenetekre kell számítanunk, mivel pl. a hívási verem (stack trace) adatai is bekerülnek.

AddressFilterMode: ez az irányító (dispatcher) működését befolyásolja. Három értéke lehet: Any, Exact és Prefix. Az Any esetén bármely, az adott porton lévő alcímet, megnevezést ehhez a szolgáltatáshoz fog irányítani. A Prefix-nél a megadott alcímmel kezdődőeket irányítja a szolgáltatásunkhoz, az Exact esetén pontosan kell megadni az alcímet.

AutomaticSessionShutdown: ezen beállítás true értéke automatikusan törli a munkamenet-változókat és -értékeket, ha minden üzenet feldolgozásra került. Ha false-ra állítjuk, akkor nekünk magunknak kell a session-t megszüntetni és beállítani az élettartam végét.

IgnoreExtensionDataObject: ezen beállítással adhatjuk meg, hogy ha a szerializálás során ismeretlen mezőértékek érkeznek, akkor azokat a továbbküldés esetén bele kell-e foglalni az üzenetbe vagy sem.

MaxItemsInObjectGraph: ez a beállítás megakadályozhatja, hogy egy ártó szándékú vagy egyéb kliens oldali működés kapcsán a bejövő üzenetbe ágyazott rengeteg adat deszerializálása túlterhelje a szervert. Ezen számérték azt mutatja, hogy a deszerializáció kapcsán maximum hány objektumpéldányt szabad kezelni.

ReleaseServiceInstanceOnTransactionComplete: ha ez true, akkor a tranzakció befejezésekor a szolgáltatáspéldány is megszűnik.

TransactionAutoCompleteOnSessionClose: ha a kliens saját oldaláról kilép (de eközben nem történik hiba), akkor az esetleg folyamatban lévő tranzakciót sikeresen lezártnak kell minősíteni.

TransactionIsolationLevel: a tranzakció izolációs szintjét lehet beállítani (Serializable, RepeableRead, ReadCommitted, ReadUncommitted, Spanshot, Chaos és Unspecified értékű lehet).

TransactionTimeout: a tranzakció maximális hosszát lehet beállítani.

UseSynchronizationContext: ennek true értéke azt jelzi, hogy a szolgáltatásunk irányítójának működési szála megegyezzen-e azzal a szállal, amely magát a host példányt is létrehozta. Ez problémás lehet, ha a szolgáltatásunkat hagyományos WinForm vagy WPF form alkalmazásban hostoljuk.

A szolgáltatás fenti beállításait a forráskódban az interfészt implementáló osztálynál lehet megadni:

         
[ServiceBehavior(InstanceContextMode = InstanceContextMode.PerCall)] 
class AutoKolcsonzo:IAutoKolcsonzo 
{ 
 ... 
}
          

További fontos beállítást végezhetünk el a ServiceMetadataBehavior osztály példányán keresztül. A példánypropertyken keresztül engedélyezhetjük a vele kapcsolatban álló szolgáltatással kapcsolatos metaadatok (jellemzően a WSDL leírás) automatikus generálását és publikálását.

  • HttpGetEnabled: engedélyezhetjük a HTTP protokoll GET metódusán keresztüli metaadatok letöltését.

  • HttpGetUrl: ha az előzőekben engedélyezzük a letöltést, megadhatjuk melyik url-en keresztül kérhetjük le a metaadatokat.

  • HttpsGetEnabled: hasonló a szerepe, de most a HTTPS protokollon keresztüli letöltést engedélyezhetjük.

  • HttpsGetUrl: és itt adhatjuk meg az url-t a HTTPS protokoll használatához.

  • MetadataExporter: ezen propertybe helyezett példány generálja le a metaadatokat (az alapértelmezett viselkedés szerint a WSDL leírást XML formátumban).

A MetaDataExporter példány PolicyVersion propertyjén keresztül tudjuk pl. a WSDL leírás névterét beállítani. Jelenleg a WCF-ben a WS-Policy v1.2 és v1.5 van támogatva.

Az alábbi kódrészlet tipikus használati mód, engedélyezzük a http-n keresztüli metadata-lekérést (a host példány, melyhez a viselkedést hozzá kell rendelni, később kerül bemutatásra).

                                                                                                                                     

                                                                                                                                     
         
ServiceMetadataBehavior serviceMetadata = 
 serviceMetadata = new ServiceMetadataBehavior(); 
serviceMetadata.HttpGetEnabled = true; 
smb.MetadataExporter.PolicyVersion = PolicyVersion.Policy15; 
// host.Description.Behaviors.Add(serviceMetadata);
         

„A” – címek

Az ABC hármasból az „A” betű a cím (address) szó rövidítése. A cím adja meg

  • az átviteli sémát (az átviteli protokollt),

  • a szerver helyét (a számítógép azonosítóját, elsősorban URL vagy IP-cím alapján),

  • a portot,

  • az útvonalat (path), amely a porthoz kapcsolódó több szolgáltatás közül választja ki a címzettet.

A cím egyelőre ugyanolyannak képzelhető el, mint az RPC fejezet kapcsán felépített szolgáltatásazonosító, tehát pl. http://myserver.com/myservice formájú.

Az átviteli protokollok jellemzően az alábbiak lehetnek:

  • http: korábban már ismertetésre került, a webkiszolgálókra jellemző protokoll

  • https: a http secure (titkosított) változata

  • tcp: bináris átvitelt jelöl, előtagként net.tcp:// formában használjuk

  • peer hálózat: net.p2p:// előtag

  • IPC: net.pipe:// ez processzek közötti (gépen belüli) kommunikáció esetén használható (inter-process communication over named pipes)

  • MSMQ: net.msmq:// a Message Queue használatát jelölő protokoll

Végpontok

A végpontok (endpoint) a szolgáltatásdefiníciók hármasa. Minden végpont tartalmaz:

  • „A”: address, vagyis címet,

  • „B”: binding, vagyis kötést,

  • „C”: contract, vagyis szerződést.

Egy szolgáltatásunk több végponttal is rendelkezhet. Megoldható az, hogy az egyes végpontokban akár ugyanaz a szolgáltatás (függvényhalmaz, contract) kerül publikálásra, de eltérő protokollokon (binding) vagy az egyes címeken (address) más-más szolgáltatások érhetőek el.

Szerver

Szerver alkalmazásokat többféleképpen készíthetünk, többféle hosting lehetőségünk van. A „hosting” magyarra fordítása nem egy könnyű feladat, találó lehet az „üzemeltetés”, valamint a „kiszolgálás” is, mivel itt a hostingon az egyszerű üzemeltetésen túl valamiféle gazdaszerep ellátását és értjük.

Lehetőség van a következőkre:

  • Self-Hosting: a szolgáltatás a teljes szerverfunkcionalitást tartalmazza. Ez természetesen nem jelenti hatalmas kódmennyiség írását, hiszen az RPC kapcsán is láthattuk már, hogy ez esetben is inkább a WCF motor konfigurálására kell felkészülnünk.

  • MWS (Managed Windows Services): ekkor a szolgáltatásunk mint egy Windows szolgáltatás kerül regisztrálásra, indítása, leállítása – tehát a menedzselése – a szokásos operációs rendszerbeli felületen oldható meg. A szolgáltatás ekkor is self-hosting típusú, hiszen a Windows szolgáltatások alapvetően nem tartalmaznak ez irányú támogatásokat.

  • IIS alapú hosting: elsősorban az ASMX webszolgáltatások esetén választható, jellemzően csak HTTP protokollal képes együttműködni.

  • WAS (Windws Process Activation Service): a Vista és a Windows Server 2008 verziókban jelent meg először. Nem igényli az IIS jelenlétét, de sok olyan jellemzője van, mely az IIS hosting sajátja – de nem kötődik pl. a HTTP protokollhoz.

Self-hosting

A legegyszerűbben megvalósítható megoldás a self-hosting. A szerverként futó programok ritkán tartalmaznak színes, egérvezérléses kezelőfelületet, hogy minimalizálják a szoftver erőforrásigényét és komplexitását. Célszerű választásnak tűnik a konzolos felület.

Első lépésben adjuk hozzá a System.ServiceModel assemblyt az Add Reference menüpontban, valamint vegyük fel az alábbi két using-ot a listába:

         
using System.ServiceModel; 
using System.ServiceModel.Description;
          

Második lépésben készítsük el a szolgáltatással kapcsolatos szerződéseket:

      
[ServiceContract()] 
public interface IAutoKolcsonzo 
{ 
 [OperationContract] 
 double CalculatePrice(DateTime kezdoDatum, 
      DateTime zaroDatum, string autoTipus); 
}
     
                                                                                                                                               

                                                                                                                                               
    

El kell készítenünk a szolgáltatást ténylegesen megvalósító objektumosztályt, mely implementálja a fenti interfészt. Mivel most nem a szolgáltatás tényleges kódjára koncentrálunk, hanem a szerver megvalósítására, így a függvény törzsében egy egyszerű véletlen értéket fogunk visszaadni.

      
class AutoKolcsonzo:IAutoKolcsonzo 
{ 
static Random rnd = new Random(); 
public double CalculatePrice(DateTime kezdoDatum, 
               DateTime zaroDatum, string autoTipus) 
{ 
      return 10.0+rnd.Next(10,100)/10.0; 
} 
}
     

A következő lépésekben felkészülünk a self-hosting megvalósítására. Választanunk kell egy elérhetőséget („address”). A localhost-választásról a korábbi fejezetekben már beszéltünk, ez esetben a szolgáltatásunkat csak a saját gépen futó másik alkalmazás fogja tudni csak megcímezni, megszólítani. A teszteléshez ez kiválóan megfelelő, de a végleges telepítéskor természetesen ezt a szerver gép külső helyről is elérhető IP-címre vagy az IP-címhez tartozó DNS névre kell cserélni.

      
Uri baseAddress = new Uri("http://localhost:8080/autok");
     

A szolgáltatás hosztolásához a ServiceHost osztály példányát kell elkészítenünk. A konstruktornak a szolgáltatást megvalósító osztály típusát (singlecall) vagy egy konkrét példányt (singleton) kell átadnunk, valamint a címet (vagy címek egy tömbjét).

      
ServiceHost host = new ServiceHost(typeof(AutoKolcsonzo), baseAddress);
     

Amennyiben engedélyezni szeretnénk, hogy ezen a címen a kliensek a WSDL leírást is le tudják tölteni, engedélyeznünk kell azt.

      
// metadata publikalas engedelyezese 
ServiceMetadataBehavior smb = new ServiceMetadataBehavior(); 
smb.HttpGetEnabled = true; 
smb.MetadataExporter.PolicyVersion = PolicyVersion.Policy15; 
host.Description.Behaviors.Add(smb);
     

A továbbiakban (ha a „host” példányt teljesen konfiguráltnak tekintjük) el kell indítani a WCF motort, hogy a megadott portot nyissa meg, kezelje a bejövő függvényhívásokat. Vegyük észre, hogy explicit módon nem adtunk meg végpontot (endpoint), de az előző függvényhívásokban definiáltuk a szükséges adatokat (a host példány konstruktorában adtuk meg a szerződést, a címben megadott http protokoll alapján a WCF az alapértelmezett BasicHttpBinding kötést fogja alkalmazni)!

      
host.Open();
     
                                                                                                                                               

                                                                                                                                               
    

Ez a függvényhívás a WCF motort külön szálon indítja el, így a Main függvény fut tovább. Mielőtt a programunk elérné a Main függvény végét (és eltűnte a konzolos kezelőfelületünk) célszerű leállítani a WCF motort, lezárni a hostolást. Konzolos alkalmazás esetén ezért érdemes egy várakozást beiktatni:

      
Console.WriteLine("A␣szolgáltatás␣fut:␣[{0}]", baseAddress); 
Console.WriteLine("Üsd␣le␣az␣<Enter>-t␣hogy␣a␣program␣leálljon."); 
Console.ReadLine();
     

A WCF motor korrekt leállítását, a port bezárását az következő módon lehet megtenni:

      
host.Close();
     

A teljes kód az alábbi módon néz ki:

      
Uri baseAddress = new Uri("http://localhost:8080/autok"); 
ServiceHost host = new ServiceHost(typeof(AutoKolcsonzo), baseAddress); 
// metadata publikalas engedelyezese 
ServiceMetadataBehavior smb = new ServiceMetadataBehavior(); 
smb.HttpGetEnabled = true; 
smb.MetadataExporter.PolicyVersion = PolicyVersion.Policy15; 
host.Description.Behaviors.Add(smb); 
// 
host.Open(); 
// 
Console.WriteLine("A␣szolgáltatás␣fut:␣[{0}]", baseAddress); 
Console.WriteLine("Üsd␣le␣az␣<Enter>-t␣hogy␣a␣program␣leálljon."); 
Console.ReadLine(); 
// 
host.Close();
     

Ezt a módszert imperatív megoldásnak nevezzük, melynek lényege, hogy mindent a forráskódban szereplő beállítások oldanak meg. Ezt a programozók gyakran hard-coded megoldásnak vagy bedrótozás-nak nevezik, mivel a program működésének bárminemű változtatásához a forráskódban kell módosításokat elvégezni. Nyilvánvalóan nem ez a legjobb módszer, de mindenképpen a legegyszerűbb. A konzolos szerverünk képernyőjének képét lásd a 11.13. ábrán.

11.13. ábra. A self-hosting szerver képernyője

Konfigurációs fájl

A beállítások egy részét a korábbi fejezetekben futólagosan ismertetett app.config fájlbeli beállításokkal befolyásolni tudjuk, de a WCF konfigurálási lehetőségei ennél jóval kifinomultabbak.

A WCF motor nagyrészt automatikusan kezeli az App.config fájlbeli beállításokat. A konfigurációs fájl felépítése természetesen szabályos kell, hogy legyen, de ez szerencsére logikus, valamint be fogunk mutatni egy grafikus (winform) felületű alkalmazást, mely a konfig fájl szerkesztését nagyban megkönnyíti.

Első lépésben ismerjük meg a manuális beállítási módszert. Az App.config fájlban a configuration szekcióban nyitni kell egy system.serviceModel szekciót (ha még emlékszünk rá, ez a csatolt assembly neve is egyúttal). A serviceModel-ben behaviors és services szekciókat hozhatunk létre, egyet-egyet, ha szükséges. Az előbbiben adhatjuk meg a viselkedési beállításokat, pl. a metaadatok generálását, az utóbbiban definiálhatunk végpontokat és szolgáltatásokat.

         
<configuration> 
<system.serviceModel> 
 <behaviors> 
  <serviceBehaviors>...</serviceBehaviors> 
  <serviceBehaviors>...</serviceBehaviors> 
  <serviceBehaviors>...</serviceBehaviors> 
 </behaviors> 
 <services> 
   <service>...</service> 
   <service>...</service> 
   <service>...</service> 
 </services> 
</system.serviceModel> 
</configuration>
          

Elsőként ismerjük meg a serviceBehaviors belsejét. Ebbe az XML szekcióba behavior szekciókat nyithatunk, melyeknek egyedi nevet adhatunk a name attribútumon keresztül. Ezekre úgy kell gondolni, mintha ServiceMetadataBehavior példányok létrehozását és beállítását végeznénk el, mely példányoknak ez lenne az azonosítója. A példányok propertyjeinek értékeit állíthatjuk be.

      
<serviceBehaviors> 
<behavior name="autoKolcsonzoViselkedes"> 
   <serviceMetadata httpGetEnabled ="true" 
               httpGetUrl="http://localhost:8080/autok" 
               policyVersion="Policy15" /> 
 </behavior> 
</serviceBehaviors>
     

A 11.14. ábrán láthatjuk, ahogy a Windows SDK részét képező SvcConfigEditor program grafikus felületén megjelenítjük ugyanezt az XML szekciót. A bal oldali konfigurációs fában tallózzuk ki az Advanced ágat, azon belül a Service Behaviors ágat, ott találhatjuk meg a bejegyzéseket.

11.14. ábra. A viselkedés – SvcConfigEditor.exe

A service részen állíthatjuk be a szolgáltatásunkat, miközben hivatkozhatunk a szolgáltatásviselkedésre annak neve alapján. A szolgáltatás beállításai automatikusan hozzárendelődnek az egyes típushoz, annak neve alapján. Az App.config fájl nem áll szoros kapcsolatban a forráskódunkkal, pl. nem ismeri az ottani using beállításokat, ezért itt az osztályok minősített neveit (névtérrel együtt) kell megadni (name).

         
<service 
  name="WcfSzolgaltatas.AutoKolcsonzo" 
  behaviorConfiguration="autoKolcsonzoViselkedes" > 
  ... 
< /service >
          

A szolgáltatásunk beállításai során endpoint-okat, végpontokat is meg kell adni. Opcionálisan nevet is adhatunk az egyes végpontoknak (11.15. ábra). Az editorban a Services ágat lenyitva találjuk meg a beállításokat.

         
<service ...> 
 <endpoint name="endpoint_01" 
         address="http://localhost:8080/autok" 
         contract="WroWcfSzolgaltatas.IAutoKolcsonzo" 
         binding="basicHttpBinding"> 
 </endpoint > 
</service>
          

11.15. ábra. A végpont – SvcConfigEditor.exe

Egyszerre több végpontot is hozzárendelhetünk egyetlen szolgáltatáshoz – miközben csak egy szolgáltatásviselkedést adhatunk meg. A teljes App.config az alábbi módon néz ki:

         
<?xml version="1.0" encoding="utf-8" ?> 
<configuration> 
 <system.serviceModel> 
   <behaviors> 
    <serviceBehaviors> 
      <behavior name="autoKolcsonzoViselkedes"> 
       <serviceMetadata httpGetEnabled="true" 
            httpGetUrl="http://localhost:8080/autok" 
            policyVersion="Policy15" /> 
      </behavior> 
    </serviceBehaviors> 
   </behaviors> 
   <services> 
    <service behaviorConfiguration="autoKolcsonzoViselkedes" 
           name="WcfSzolgaltatas.AutoKolcsonzo"> 
      <endpoint name="endp01" 
             address="http://localhost:8080/autok" 
             contract="WcfSzolgaltatas.IAutoKolcsonzo" 
             binding="basicHttpBinding"> 
      </endpoint> 
    </service> 
    </services> 
 </system.serviceModel> 
</configuration>
          

Ez esetben az alkalmazás Main függvénye sokkal rövidebben nézhet ki:

      
ServiceHost host = new ServiceHost(typeof(AutoKolcsonzo)); 
host.Open(); 
// 
Console.WriteLine("A␣szolgáltatás␣fut␣..."); 
Console.WriteLine("Üsd␣le␣az␣<Enter>-t␣hogy␣a␣program␣leálljon."); 
Console.ReadLine(); 
// 
host.Close();
     

Figyeljük meg, ahogy a programkód és a konfigurációs fájlbeli beállítások összekapcsolódnak! A typeof(AutoKolcsonzo) kapcsán a host konstruktora megkapja a szolgáltatáspéldányunk típusát. Ekkor észleli, hogy a típus teljes (minősített) neve a WcfSzolgaltatas.AutoKolcsonzo. Automatikusan ellenőrzi, hogy tartozik-e ezen típusnévhez service. Mivel talál, így elkezdi azt feldolgozni. A kapcsolt viselkedést a neve alapján (autoKolcsonzoViselkedes) megkeresi a serviceBehaviors szekcióban, és alkalmazza az ottani beállításokat is.

Kliens

Ha a szervert elkészítettük, indítsuk el! Ez a lépés azért szükséges, mert a kliens készítésének egyik első lépésében le fogjuk kérdezni a szerver WSDL leírását. Ez csak akkor lehetséges, ha a szerver alkalmazás fut, és a szolgáltatás viselkedésében a metaadatok publikálását engedélyeztük.

A kliens program típusára nincs megkötés. Ugyanúgy lehet Windows Forms, akár WPF-alapú, működhet webes felületű ASP.NET alkalmazásként, de akár konzolos felületen is. Egyszerűsége miatt válasszuk ez utóbbit!

A projekt létrehozása után adjuk hozzá a System.ServiceModel assemblyt az Add Reference menüpontban, valamint vegyük fel az alábbi két using-ot a listába:

      
using System.ServiceModel; 
using System.ServiceModel.Description;
     

Kattintsunk a Solution Explorer-ben a szolgáltatás hozzáadása (11.16. ábra) menüpontra! A felbukkanó párbeszédablakba gépeljük be a szolgáltatás útvonalát, majd kattintsunk a Go nyomógombra. A Visual Studio lekéri a WSDL leírást, majd feldolgozza azt. Az eredményt ugyanebben a párbeszédablakban tallózhatjuk. Állítsuk be a proxy osztályt, melyik névtérbe (namespace) kívánjuk elhelyezni, majd kattintsunk az OK gombra (11.17. ábra)!

11.16. ábra. Szolgáltatás hozzáadása menüpont

11.17. ábra. Szolgáltatás hozzáadása párbeszédablak

A Visual Studio igen fejlett módon nem a C# forráskód formájában generálja le a proxy osztályt, hanem a kliens App.config fájlba helyezi el annak leírását.

Az előállított XML fájl végén a clients részen találhatjuk az ismerősebb részt, míg a binding szekcióban a kapcsolat beállításait. A 11.18. ábrán láthatjuk, hogy a sikeres szolgáltatás-hozzáadás után a Solution Explorerben egy újabb bejegyzés jelenik meg, mutatja a külső referenciákat. A megfelelő szolgáltatásra jobb egérgombbal kattintva igen hasznos menüpontot láthatunk: Update Service Reference. Ennek segítségével könnyedén frissíthetjük a szolgáltatás WSDL leírását a projektünkben, amennyiben verzióváltás történne a szerver oldalon.

11.18. ábra. Szolgáltatás frissítése

A generált XML leírás az alábbiak szerint néz ki. A Windows SDK csomagban található SvcConfigEditor.exe segítségével ezt az App.config fájlt is lehet szerkeszteni grafikus felületen (11.19. ábra). Ennek jelentőségét nem kell részletezni, a program forráskódjának módosítása nélkül a telepített környezet rendszergazdája képes akár a helyi házirendnek megfelelően kiegészíteni, módosítani az üzenetforgalmazást.

11.19. ábra. A kliens oldali app.config szerkesztése

A generált App.config:

         
<?xml version="1.0" encoding="utf-8" ?> 
<configuration> 
<system.serviceModel> 
 <bindings> 
   <basicHttpBinding> 
   <binding name="endp01" 
       closeTimeout="00:01:00" 
       openTimeout="00:01:00" 
       receiveTimeout="00:10:00" 
       sendTimeout="00:01:00" 
       allowCookies="false" 
       bypassProxyOnLocal="false" 
       hostNameComparisonMode="StrongWildcard" 
       maxBufferSize="65536" 
       maxBufferPoolSize="524288" 
       maxReceivedMessageSize="65536" 
       messageEncoding="Text" 
       textEncoding="utf-8" 
       transferMode="Buffered" 
       useDefaultWebProxy="true"> 
        <readerQuotas maxDepth="32" 
                  maxStringContentLength="8192" 
                  maxArrayLength="16384" 
                  maxBytesPerRead="4096" 
                  maxNameTableCharCount="16384" /> 
           <security mode="None"> 
            <transport clientCredentialType="None" 
                    proxyCredentialType="None" 
                    realm="" /> 
              <message clientCredentialType="UserName" 
                     algorithmSuite="Default" /> 
           </security> 
    </binding> 
   </basicHttpBinding> 
 </bindings> 
 <client> 
    <endpoint 
         address="http://localhost:8080/autok" 
         binding="basicHttpBinding" 
         bindingConfiguration="endp01" 
         contract="Kolcsonzes.IAutoKolcsonzo" 
         name="endp01" /> 
 </client> 
</system.serviceModel> 
</configuration>
          

A projekthez hozzáadott szolgáltatást a 11.18. ábrán is látható menüpontok közül a View in Object Browser menüpont segítségével is megvizsgálhatjuk. Azért érdemes ezt megtenni, mert így felfedezhetjük, hogy a kliens oldalon (jelen példában) a ConsoleApplication3.Kolcsonzes névtérbe generált AutoKolcsonzoClient proxy osztályt kaptuk – ezen osztály segítségével tudjuk a kliens oldali kódot elkészíteni. Másrészről a projektet fájlszerkezet szinten tallózva (pl. Windows Explorer – Tallózó) észlelhetjük, hogy keletkezett egy Service Reference mappa is, melyben egy Kolcsonzes mappa is létrejött. Ebbe a mappába betekintve megtalálhatjuk a letöltött WSDL dokumentumot, valamint egy Reference.cs fájlt, melybe a proxy osztályunk kódja tárolásra került. Ezt a mappát a látjuk a Solution Explorerben egyetlen ikonként ábrázolva.

11.20. ábra. A szolgáltatás proxy az Object Browserben

A kliens kódjának írását kezdjük azzal, hogy az említett névteret a using segítségével felnyitjuk! Az említett osztályból (AutoKolcsonzoClient) példányt készítünk, majd meghívjuk a szerződésben is leírt CalculatePrice metódust. A szerverbeli implementáció egyelőre nem használ ki semmit a bemenő paraméterekből, csak egy véletlen értéket generál mint visszatérési érték.

         
// using ConsoleApplication3.Kolcsonzes; 
 
AutoKolcsonzoClient p = new AutoKolcsonzoClient(); 
double x = p.CalculatePrice(DateTime.Now, DateTime.Now, "Mercedes"); 
Console.WriteLine(x); 
Console.ReadLine();
          

Loginalapú szerver

Legyen az a feladat, hogy készítsünk el egy olyan szerver szolgáltatást, mely egyfajta vállalati belső üzenetküldési rendszert kezel (mint egy SMS-szolgáltatás)! A felhasználók üzeneteket küldhetnek egymásnak, mely üzeneteket a célszemélyek megkaphatják, miután azonosították magukat egy belépési névvel és jelszóval. Az üzenetek tárolását megvalósíthatjuk adatbázisban is, de a szerver memóriájában is. Ez utóbbi komolytalanabb megvalósítás, de sokkal tanulságosabb, így ezt a megvalósítást választjuk.

Első lépésként tervezzük meg a szolgáltatásba tartozó függvényeket:

  • egy függvény a bejelentkezéshez (bejelentkezes),

  • egy függvény, hogy lekérdezhessük az olvasatlan üzenetek számát (olvasatlanDarab),

  • egy függvény, hogy lekérdezhessük az utolsó tárolt üzenetek sorszámát (utolsoUzenetSorszam),

  • egy függvény, hogy lekérdezhessünk egy adott sorszámú üzenetet (letoltes),

  • egy függvény, hogy töröljünk egy adott sorszámú üzenetet a saját listánkból (statuszBeallitas),

  • egy függvény az üzenetküldéshez (valamely személy részére, uzenetBekuldes),

  • egy függvény a kilépéshez (kilepes).

Nyilván rengeteg ötletünk lehet, hogyan tudnánk még bővíteni ezt a szolgáltatást még új funkciókkal, de egyelőre ennyi is elég lesz.

Csak sikeres belépés után

A legtöbb függvényünk csak akkor használható, ha a belépési folyamaton sikeresen átestünk. Hogyan kezeljük ezt a problémát?

Többféle megközelítés közül választhatunk:

  • sessionkezelést alkalmazva tároljuk a munkamenet-változókat. Ezen sessionben tároljuk el, hogy a belépés megtörtént-e vagy sem. Ekkor minden függvényünk első lépése az kell legyen, hogy ellenőrizzük a belépés sikerességét (ennek hiányában kivételt generálhatunk).

  • egyedi példányt kérünk a WCF motortól minden csatlakozott klienshez, és a belépés tényét példányszintű mezőben tároljuk. Ekkor nincs szükség a munkamenet kezelésére, a munkamenet helyett az adatokat a példány mezőiben tudjuk tartani. A függvények elején ugyanúgy ellenőriznünk kell, hogy a belépés megtörtént-e.

  • a WCF sorrendi hívás beállításainak segítségével megadhatjuk, hogy először csak a belépési függvényt szabad meghívni, csak utána a többit.

A megoldás vázlata

Ötvözzük a második és a harmadik módszert, vagyis használjunk kliensenként egyedi példányt, sorrendi beállításokkal! Az IsInitiating és IsTerminating mód csak session-alapú működés esetén valósítható meg, ezért a ServiceContract-ban a SessionMode értékét Required-re kell állítani.

         
public class user 
{ 
   public string nev; 
   public string jelszo; 
   public int szint; 
} 
 
public enum uzenetStatusz 
 { olvasatlan, olvasott, torolt }; 
 
[DataContract] 
public class uzenet 
{ 
   public user bekuldo; 
   public user cimzett; 
   public DateTime idopont; 
   public string uzenetSzovege; 
   public uzenetStatusz statusza; 
} 
 
[ServiceContract(SessionMode=SessionMode.Required)] 
public interface ISmsSzerver 
{ 
   [OperationContract(IsInitiating=true)] 
   bool bejelentkezes(string nev, string jelszo); 
   [OperationContract] 
   int olvasatlanDarab(); 
   [OperationContract] 
   int utolsoUzenetSorszam(); 
   [OperationContract] 
   uzenet letoltes(int sorszam); 
   [OperationContract] 
   bool statuszBeallitas(int sorszam, uzenetStatusz ujStatusz); 
   [OperationContract] 
   bool uzenetBekuldes(string celszemely, string uzenetStr); 
   [OperationContract(IsTerminating=true)] 
   bool kilepes(); 
} 
 
[ServiceBehavior(InstanceContextMode = InstanceContextMode.PerSession)] 
public class SmsSzerver : ISmsSzerver 
{ 
 static List<user> felhasznalok = new List<user>(); 
 static List<uzenet> uzenetek = new List<uzenet>(); 
 ... 
}
         
                                                                                                                                               

                                                                                                                                               
    

Mint láttuk, definiáltunk egy uzenet osztályt, mely 1 üzenetet tárol. Ezt meg kell osztanunk a szolgáltatásunkkal, mivel az egyik függvényünk (letoltes) visszatérési értéke ezen osztály egy példánya. A user rekordok a felhasználói belépéshez tartozó adatokat tárolják, de egyik függvényünk sem használja őket sem paraméter-, sem visszatérési típusként, így nem kell megosztani a szolgáltatással.

A felhasználók adatait egy statikus listában (felhasznalok) tároljuk, az összes felhasználóhoz tartozó összes üzenetet pedig az uzenetek statikus listában. Ezen listák közösek lesznek az egyes kliensek hívásai során, így a velük való munka folyamán majd zárolnunk (lock) kell őket.

A titkosítás

A hálózaton a függvényhívások (elsősorban bejelentkezés) kapcsán felhasználói nevek és jelszavak fognak utazni. Mindenképpen szükségesnek tűnik alapszintű biztonság, titkosítás használata. Válasszunk olyan kötést (binding), amelynél ez megvalósítható!

Tudjuk, hogy az alap HttpBinding esetén a függvényparaméterek egy SOAP szabványú egyszerű XML fájlba kerülnek, és ebben a formában kódolatlanul utaznak a hálózaton. A csomagok egyszerű figyelésével megtudható az egyes felhasználók bejelentkező neve és jelszava – mindössze meg kell várni, míg megpróbál bejelentkezni. Válasszuk hát kötési típusnak a wsHttpBinding-ot! Szerencsére ezt nem kell kód szinten eldöntenünk, mivel az App.config beállítását utólag, rendszergazdákkal konzultálva is elvégezhetjük.

Ez esetben felmerül egy fontos kérdés. A frissen hozzáadott App.config egyelőre üres. Hogyan alakítsuk ki benne a konfigurációs szekciót, amelyet később módosíthatunk az SDK eszközével (SvcConfigEditor.exe)? Egyelőre készítsük el az implementációs osztályt üresre, valamint a Main függvényt is alapszinten, aztán nézzük, mit tehetünk a problémával!

      
[ServiceBehavior(InstanceContextMode = InstanceContextMode.PerSession)] 
public class SmsSzerver : ISmsSzerver 
{ 
   static List<user> felhasznalok = new List<user>(); 
   static List<uzenet> uzenetek = new List<uzenet>(); 
 
   public bool bejelentkezes(string nev, string jelszo) 
   { 
      return false; 
   } 
   public int olvasatlanDarab() 
   { 
      return 0; 
   } 
   public int utolsoUzenetSorszam() 
   { 
      return 0; 
   } 
   public uzenet letoltes(int sorszam) 
   { 
      return null; 
   } 
   public bool statuszBeallitas(int sorszam, uzenetStatusz ujStatusz) 
   { 
      return false; 
   } 
   public bool uzenetBekuldes(string celszemely, string uzenetStr) 
   { 
      return false; 
   } 
   public bool kilepes() 
   { 
      return false; 
   } 
} 
 
class Program 
{ 
 static void Main(string[] args) 
 { 
   ServiceHost host = new ServiceHost(typeof(SmsSzerver)); 
   host.Open(); 
   foreach (ServiceEndpoint e in host.Description.Endpoints) 
   { 
      Console.WriteLine("{0}␣({1})", 
               e.Address.ToString(), 
               e.Binding.Name); 
   } 
   Console.WriteLine("A␣szolgaltatas␣fut␣(Enter-re␣leall)"); 
   Console.ReadLine(); 
 } 
}
     

A fordítható programot fordítsuk le, generáljuk le a diszken a SmsSzerver.exe programot!

A szolgáltatás konfigurálása

Amennyiben sikeresen generáltuk a szerver bináris formáját (pl. exe vagy dll kiterjesztéssel), mely tartalmazza a szerződést (contract), bátran indítsuk el a SvcConfigEditor.exe-t, a menüben nyissuk meg az App.config állományt! A konfigurációs fájl kitöltetlensége miatt egy eléggé üres állapotot látunk a szerkesztőben. Kattintsunk a Services faelemhez tartozó Create a New Service... linkre! Egy párbeszédablak bukkan fel, mely a szolgáltatásunk nevére kíváncsi, de egy Browse gombot tartalmaz (11.21. ábra).

11.21. ábra. „Create a New Service ...”

A Browse segítségével keressük meg a lefordított szerver alkalmazás kódját a lemezen, és töltsük be! Jó tanács: győződjünk meg róla, hogy az SvcConfigEditor verziója 4.0 vagy annál magasabb, mivel a korábbi verziók nem képesek kezelni a 4.0-s WCF-kódokat! Valamint ha 64 bites környezetben fejlesztünk, a Platform target-et fordítás előtt állítsuk Any CPU-ra, különben az SvcConfigEditor hajlamos hibát jelezni a megnyitáskor!

Ha mindent jól csináltunk, a Browse során nem csak az .exe állományunk nevéig jutunk el, hanem a ConfigEditor ki is bontja az exe tartalmát, és kilistázza a benne található ServiceContractot tartalmazó osztályok neveit. Válasszuk ki a megfelelő osztályt (11.22. ábra)!

11.22. ábra. A szolgáltatás tallózása az .exe-ből

A következő lépésekben a varázsló megkérdezi, milyen kommunikációs módot kívánunk használni. Válasszuk a HTTP-alapú kommunikációt (11.23. ábra)! A következő lépésben válasszuk az advanced (fejlett) webszolgáltatási protokollt (11.24. ábra), a simplex (csak a kliens kezdeményez függvényhívást a szerver oldalon) kommunikációs módot! Adjuk meg a címet (11.25. ábra, pl. „http://localhost:8082/SmsSzerver”), majd kattintsunk a Finish gombra! Egyszerűnek tűnik?

11.23. ábra. A kommunikációs protokoll választása

11.24. ábra. A protokoll finomítása

11.25. ábra. A szolgáltatás címe (address)

Mivel az így elkészült konfiguráció még nem exportálja a WSDL leírást, így tovább kell kattingatnunk a felületen. Az Advanced fában az Service Behaviors részen alakítsunk ki új viselkedési szabályt (New Service Behavior Configuration, 11.26. ábra)! Nem szükséges módosítani az alapértelmezett nevet (NewBehavior0), de talán érdemes, írjuk át pl. „WSDL-Publikalas”-ra, majd kattintsunk az Add gombra (11.26. ábra)! A felbukkanó listából válasszuk ki a serviceMetaData elemet (11.27. ábra)! A hozzáadott elemre kattintsunk kettőt (duplán), hogy a részleteit tudjuk szerkeszteni (a beállítóablakot korábban már bemutattuk a 11.14. ábra alapján)!

11.26. ábra. „New Service Behavior Configuration” ablak

11.27. ábra. A viselkedés neve és az Add gomb

11.28. ábra. A viselkedési beállítás kiválasztása

Ezek után térjünk vissza a Services faelemhez, és válasszuk ki a szolgáltatásunkat! A BehaviorConfiguration részben a legördülő listából válasszuk ki a WSDL-publikálási beállítást (11.29. ábra), és mentsünk (File/Save menüpont)!

11.29. ábra. A szolgáltatás és a viselkedés összekapcsolása

Tekintsük meg a kiegészített App.config fájl tartalmát! Mint látjuk, a szolgáltatás máris beállításra került. Ha ezen lépések előtt próbáltuk meg a szervert indítani, akkor kivételt dobott a végpontok konfigurálatlan volta miatt. Anélkül, hogy a szerver bináris formáját újrafordítottuk volna, az App.config beállítások miatt a szerver máris elindul, a szolgáltatás fut.

Térjünk vissza a titkosítás beállításaihoz! Keressük meg a fában az egyetlen (név nélküli) EndPointot, annak is a BindingConfiguration részét, és kattintsunk duplán az egyelőre üres mezőben! Ez létrehoz a Bindings fában egy új bejegyzést (és automatikusan ide csatolja az ottani beállításokat), lásd a 11.30. ábra. Ha ez mégsem működne (időnként rapszodikusan viselkedik ez a lépés), akkor a Bindings fában manuálisan kell megnyitni egy új bejegyzést (ennek során biztosan meg kell adni, hogy egy wsHttpBinding-hoz kell konfigurációs beállításokat létrehozni). A beállítási panelon felül válasszuk a Security fület, ahol rendelkezhetünk a titkosításokról (11.31. ábra)!

11.30. ábra. Dupla kattintás a BindingConfigurationön

11.31. ábra. A Security fül beállítása

A „Mode” részen választhatunk, milyen szinten kívánjuk alkalmazni a titkosítást. Az alapértelmezett beállítás a „Message” szint, vagyis maga az átvitel nem titkosított (a HTTP fejléc), de a beágyazott SOAP-üzenet már kódolásra kerül. Ez nekünk meg is felel. Széles skáláról választhatunk titkosítási algoritmusokat, melyekből a Basic256 az alapértelmezett. A különböző titkosítási algoritmusok ismertetése túlmutat ezen jegyzet keretein, de tudnunk kell, hogy az egyes módszerek több-kevesebb processzoridőt kötnek le, ami lassítja a működést, de esetleg nehezebben törhetőek fel. A választás tehát fontos, de a szükségtelenül erős kódolás esetleg felesleges erőforrás-lekötéseket és lassulást eredményez.

Az EstablishSecurityContext értékét érdemes true-ra állítani. Ez azt jelenti, hogy a szerver és a kliens a kapcsolat kiépülésekor cserél titkos kulcsot, és ugyanezen kulcsot használja végig a kommunikáció során. Ellentétes értéke esetén hívásonként teszi ezt meg – ami további lassulást eredményezhet (de növeli a biztonságot).

A titkosítási beállítások áttekintése és definiálása után győződjünk meg, hogy az Endpoint beállításoknál a megfelelő Binding kiválasztásra kerüljön! A generált App.config fájl tartalmának az alábbiak szerint kell alakuljnia:

         
<?xml version="1.0" encoding="utf-8" ?> 
<configuration> 
<system.serviceModel> 
 <bindings> 
  <wsHttpBinding> 
   <binding name="WsdlTitkositas"> 
   <security mode="Message"> 
    <message clientCredentialType="Windows" 
           establishSecurityContext="true" /> 
   </security> 
   </binding> 
  </wsHttpBinding> 
 </bindings> 
 <behaviors> 
  <serviceBehaviors> 
   <behavior name="WSDL-Publikalas"> 
   <serviceMetadata httpGetEnabled="true" 
            httpGetUrl="http://localhost:8082/SmsSzerver" /> 
   </behavior> 
  </serviceBehaviors> 
  </behaviors> 
   <services> 
   <service behaviorConfiguration="WSDL-Publikalas" 
          name="SmsService.SmsSzerver"> 
    <endpoint address="http://localhost:8082/SmsSzerver" 
            binding="wsHttpBinding" 
            bindingConfiguration="WsdlTitkositas" 
            contract="SmsService.ISmsSzerver" /> 
   </service> 
   </services> 
</system.serviceModel> 
</configuration>
          

A bejelentkezés függvénye

A belépéssel kapcsolatos (legegyszerűbb) megvalósítás azon alapszik, hogy a „felhasznalok” lista már fel van töltve adatokkal (pl. fájlból korábban beolvasásra került). A foreach ciklus időtartamára a lista zárolásra kerül, nehogy egy párhuzamos folyamat (szál) új felhasználóval bővítse, vagy töröljön belőle elemet. Ha sikeresen megtaláljuk a név + jelszó párossal azonosított rekordot, akkor a példányszintű belepett mezőben elmentjük a referenciáját.

      
public class SmsSzerver : ISmsSzerver 
{ 
 static List<user> felhasznalok = new List<user>(); 
 
 protected user belepett = null; 
 public bool bejelentkezes(string nev, string jelszo) 
 { 
   lock (felhasznalok) 
   { 
    foreach (user p in felhasznalok) 
      if (p.nev == nev && p.jelszo == jelszo) 
      { 
       this.belepett = p; 
       return true; 
      } 
   } 
   return false; 
 } 
 ... 
}
     

Az „olvasatlanDarab” függvény

Abból indulunk ki, hogy az uzenet lista nemcsak egyetlen, de minden egyes felhasználó üzenetét tartalmazza. Ezért az adott felhasználó üzeneteinek megszámolásához minden egyes üzenetet sorra kell venni.

      
public int olvasatlanDarab() 
{ 
 if (belepett==null) 
   return 0; 
 int db = 0; 
 lock (uzenetek) 
 { 
   foreach (uzenet p in uzenetek) 
    if (p.cimzett == belepett 
      && p.statusza == uzenetStatusz.olvasatlan) 
      db++; 
 } 
 return db; 
}
     

Az „utolsoUzenetSorszam” függvény

Ez a függvény igazából azt mondja meg, hogy hány darab tárolt üzenetünk van. Az darab esetén az egyes üzenetekre a sorszámokkal tudunk hivatkozni, az intervallumból. A kapott sorszámok természetesen nem alkalmasak a lista közvetlen indexelésére, hiszen az adott felhasználó . sorszámú üzenete nem a lista . elemén található.

         
public int utolsoUzenetSorszam() 
{ 
 if (belepett==null) 
   return 0; 
 int db = 0; 
 lock (uzenetek) 
 { 
   foreach (uzenet p in uzenetek) 
    if (p.cimzett == belepett && 
      p.statusza!=uzenetStatusz.torolt) 
      db++; 
 } 
 return db; 
}
          

A „letoltes” függvény

A letöltés során a felhasználó definiálja, hányadik sorszámú üzenetet kívánja letölteni. A függvény feladata ennek megkeresése (és olvasott státuszba léptetése), majd visszatérési értékként az üzenet átadása a kliens felé.

      
public uzenet letoltes(int sorszam) 
{ 
if (belepett == null) 
   return null; 
int db = 0; 
lock (uzenetek) 
{ 
 foreach (uzenet p in uzenetek) 
 { 
  if (p.cimzett == belepett ) db++; 
    if (db == sorszam && 
      p.statusza!=uzenetStatusz.torolt) 
    { 
            p.statusza = uzenetStatusz.olvasott; 
            return p; 
    } 
 } 
} 
return null; 
}
     

A „statuszBeallitas” függvény

Valamely üzenetünk státuszát tudjuk beállítani azzal, hogy megadjuk az üzenet sorszámát, majd az új státuszát. Mivel a törlés az üzenetekben csak logikai (az üzenetet fizikailag nem távolítjuk el), a számolásnál a törölteket ki kell hagyni. A függvény true értékkel jelzi az üzenet státuszának sikeres módosítását.

      
public bool statuszBeallitas(int sorszam, uzenetStatusz ujStatusz) 
{ 
 if (belepett == null) 
   return false; 
 int db = 0; 
 lock (uzenetek) 
 { 
   foreach (uzenet p in uzenetek) 
   { 
    if (p.cimzett == belepett) db++; 
    if (db == sorszam && 
      p.statusza!=uzenetStatusz.torolt)) 
    { 
      p.statusza = ujStatusz; 
      return true; 
    } 
   } 
 } 
 return false; 
}
     

Az „uzenetBekuldes” függvény

Új üzenet beküldésekor az üzenet „küldője” a bejelentkezett felhasználó, a címzett nevét azonban meg kell adni (és ki kell keresni a felhasználók listájában). Az új üzenetet hozzá kell adni „olvasatlan” státusszal a listához.

      
public bool uzenetBekuldes(string celszemely, string uzenetStr) 
{ 
 if (belepett == null) 
   return false; 
 uzenet p = new uzenet(); 
 p.bekuldo = this.belepett; 
 p.cimzett = null; 
 lock(felhasznalok) 
 { 
   foreach (user x in felhasznalok) 
   if (x.nev == celszemely) 
   { 
     p.cimzett = x; 
     break; 
   } 
} 
if (p.cimzett == null) 
   return false; 
p.statusza = uzenetStatusz.olvasatlan; 
p.uzenetSzovege = uzenetStr; 
lock (uzenetek) 
   uzenetek.Add(p); 
return true; 
}
     
                                                                                                                                               

                                                                                                                                               
    

A „kilepes” függvény

A kilépés akkor lehetséges, ha a belépés megtörtént. A kilépés tényét úgy tároljuk el, hogy a példányszintű mezőbe null értéket helyezünk.

      
public bool kilepes() 
{ 
 if (belepett == null) 
    return false; 
 this.belepett = null; 
 return true; 
}
     

A tesztelés előkészítése

Egy gyors megoldást kerestünk, hogy egyszerű módon lehessen a felhasználói listát bővíteni. Készítsünk egy statikus függvényt az SmsSzerver osztályba, melynek segítségével felhasználókat lehet hozzáadni a listához! Ezt a tevékenységet még a host indítása előtt végezzük el, ezért nincs szükség a felhasznalok lista zárolására. Ezenfelül felvettünk egy szin mezőt a user rekordba, hogy az egyes felhasználókkal kapcsolatos működést más-más szín jellemezze.

      
public class user 
{ 
 ... 
 public ConsoleColor szin = ConsoleColor.White; 
} 
 
public class SmsSzerver : ISmsSzerver 
{ 
 public static void addFelhasznalok(string nev, 
     string jelszo, int szint, ConsoleColor szin) 
 { 
   user p = new user(); 
   p.nev = nev; 
   p.jelszo = jelszo; 
   p.szint = szint; 
   p.szin = szin; 
   felhasznalok.Add(p); 
 } 
 ... 
}
     

A gyors tesztelés érdekében a Main függvény elején definiáljunk két felhasználót (a fájlból olvasás helyett):

      
static void Main(string[] args) 
{ 
   SmsSzerver.addFelhasznalok("zozo","titok",10,ConsoleColor.Yellow); 
   SmsSzerver.addFelhasznalok("lajos", "titkos", 5, ConsoleColor.Blue); 
   ... 
}
     

Loginalapú kliens

Készítsük el a klienst a szerverhez! Indítsuk el a WSDL-publikálásra felkészített szervert, és adjuk hozzá a klienshez a cím alapján a szolgáltatást! Készíthetünk egy egyszerű felületű Windows Forms klienst is, de jelen tesztünkhöz egy gyors konzolos program is megfelel (pontosabban kettő, hogy ellenőrizhessük az egyidejű működést is).

A konzolos programok minden egyes lépés után várják az Enter leütését a következő ténykedés előtt. Több tesztet fogunk végezni, melyek közben a szervert nem állítjuk le (így a memóriában folyamatosan gyűjtik az üzeneteket, illetve a szerver konzolos képernyője nem törlődik a tesztek közben). A szerver minden egyes funkcióját kiegészítjük konzolos kiírásokkal, melyek tájékoztatnak arról, melyik felhasználó melyik szerver függvényt hívta meg milyen adatokkal. A kiírást minden esetben a belépett felhasználóhoz rendelt színnel jelenítjük meg.

Sorrendi teszt

Az első tesztben a következő tevékenységet hajtjuk végre:

  • bejelentkezés nélkül letölti az 1-es sorszámú üzenetet.

A tapasztalat szerint a függvényhívás gond nélkül átmegy a WCF rendszeren, és a függvény működésének megfelelően visszatér null értékkel. Ez azt jelenti, hogy a wsHttpBinding mellett ez a funkció nem működik.

Bejelentkezés egy felhasználóval

Az alábbi tevékenységet hajtjuk végre:

  • bejelentkezünk zozo felhasználóként,

  • lekérdezzük az olvasatlan üzenetek számát,

  • küldünk egy üzenetet lajos felhasználónak,

  • küldünk egy üzenetet zozo felhasználónak (saját magunknak),

  • lekérdezzük az olvasatlan üzenetek számát,

  • kilépünk.

A szerverképernyőn (11.32. ábra) láthatjuk, amint a még nem bejelentkezett (és emiatt színnel még nem rendelkező) felhasználó belép. A továbbiakban minden függvényhívás a „zozo” felhasználó nevében (és színével fut) le. A kliensképernyő képe a 11.33. ábrán látható.

11.32. ábra. 2. teszt: a szerverképernyő

11.33. ábra. 2. teszt: a kliensképernyője

Bejelentkezés két felhasználóval párhuzamosan

A harmadik tesztünkben ugyanezen lépéseket ismételjük meg, de két kliens programmal. Az első program a zozo, a második a lajos felhasználó nevében fut. A szerver képernyőjén (11.34. ábra) láthatjuk, ahogy a szerver tökéletesen követi, melyik felhasználóval kommunikál, a megfelelő színnel jelölve a függvényhívási kiírásokat, valamint a megfelelő felhasználónevet használja a kiírásoknál. Ez igazolja, hogy a kódban megadott PerSession jól működik – mindkét felhasználó saját objektumpéldányt (és saját példányszintű mezőket) kapott a kommunikáció során.

11.34. ábra. 3. teszt: a szerverképernyő

Titkosítás ellenőrzése

A bejelentkezéskor említettük a problémát, hogy az üzenetek titkosítatlansága veszélyes lehet az alkalmazásunkban. Tettünk ellenlépéseket, mikor a kötéshez üzenetszintű titkosítási algoritmust rendeltünk, de vajon az működik is? Hogyan tudnánk ellenőrizni?

Nyissuk meg az App.config fájlt az SvcConfigEditor.exe segítségével! Válasszuk ki a Diagnostics faelemet baloldalt (11.35! ábra). A jobb oldali panelon

  • kattintsunk az Enable Message Logging-ra („Üzenetnaplózás engedélyezése”),

  • ellenőrizzük, hogy a Log Level („Naplózási Szint”) esetén a Transport message rész legyen bekapcsolva,

  • a Log file name beállítást itt nem tudjuk módosítani,

  • lépjünk be a Message Logging fába, és állítsuk a LogEntireMessage bejegyzést true értékre.

  • lépjünk be a Diagnostics/Listeners elemhez, majd az abban időközben létrejött Listeners (figyelő) bejegyzéshez – a naplófájl nevét ott tudjuk módosítani (General/InitData, 11.36. ábra).

Háromféle naplózást kérhetünk:

  • Malformed message: rosszul formázott (s emiatt elutasított) üzenet (pl. mérettúllépés),

  • Service message: szolgáltatásszintű üzenet, pl. tranzakciókkal, titkosításokkal kapcsolatos extra üzenetek,

  • Transport message: a transzportszinten forgalmazott üzenetek.

11.35. ábra. A Diagnostics bekapcsolása

11.36. ábra. A naplófájl nevének beállítása

Az App.config beállítások az alábbiakkal egészülnek ki:

     <?xml version="1.0" encoding="utf-8" ?>
    <configuration>
     <system.diagnostics>
      <sources>
       <source name="System.ServiceModel.MessageLogging"
                  switchValue="Warning, ActivityTracing">
        <listeners>
         <add type="System.Diagnostics.DefaultTraceListener"
               name="Default">
           <filter type="" />
         </ add >
         <add name="ServiceModelMessageLoggingListener">
           <filter type="" />
         </add>
        </listeners>
       </source>
      </sources>
      <sharedListeners>
       <add initializeData="App_messages.svclog"
            type="System.Diagnostics.XmlWriterTraceListener,
               System, Version=4.0.0.0, Culture=neutral,
               PublicKeyToken=b77a5c561934e089"
            name="ServiceModelMessageLoggingListener"
            traceOutputOptions="Timestamp">
             <filter type=""/>
       < / add>
      </sharedListeners>
     </system.diagnostics>
     <system.serviceModel>
      <diagnostics>
         <messageLogging logEntireMessage="true"
            logMalformedMessages="false"
        logMessagesAtServiceLevel="false"
        logMessagesAtTransportLevel="true" />
        </diagnostics>
        <client />
        ...
      </diagnostics>
     </system.serviceModel>
    <configuration> 

Futtassuk a szervert, majd valamely tesztelési célra fejlesztett kliens alkalmazást! Amikor befejezzük a tesztelést, zárjuk be a szervert, és ellenőrizzük, hogy a beállításnak megfelelő naplófájl a lemezen megtalálható-e (c:\App_messages.svclog)!

A naplófájlba betekintve kiderül, hogy ez egy XML fájl (bár ez nem meglepő). Speciális szerkezettel rendelkezik, melyen megpróbálhatunk eligazodni, de nem lesz könnyű. Az SDK-ban van egy erre a célra fejlesztett eszköz, az SvcTraceViewer.exe. Ezzel az eszközzel megnyithatjuk a naplófájlt (11.37. ábra). A naplózott üzeneteket tallózva hamarosan megtaláljuk a bejelentkezés hívásához tartozó üzenetet. A paraméterek (a felhasználói név és jelszó) azonban titkosítva van, az üzenet tartalmát tehát megfejteni nem triviális.

11.37. ábra. A naplófájl üzeneteinek tallózása

Egyéb WCF-tulajdonságok

Az App.config, a külső konfigurációs fájlok segítségével tudtuk az üzenetek naplózását (a naplózás részleteit, helyét) beállítani. Ez nagyszerű eszköz a szolgáltatás üzemeltetői számára, így ugyanis elemezhetik, feldolgozhatják a naplóbejegyzéseket, működési problémák után kutatva.

Hasonló módon elemezhetjük a teljesítménymutatókat is (másodpercenként beérkező üzenetek száma, kliensek száma, az egyes üzenetek feldolgozási időtartama stb.). Ezt is a külső konfigurációs fájlban állíthatjuk be, a Diagnostics részen, a Performance Counter (teljesítményszámláló) részen.

Amennyiben a szolgáltatásunk működéséhez szükséges, kérhetünk tranzakciókezelést. A tranzakciók műveletek olyan gyűjteményei, amelyek atomiak, összefüggőek, izolálhatóak. A WCF ehhez WS-AT (WS-AtomicTransaction) protokollt használ, és képes integrálni az OLE korábbi tranzakciós megvalósítását is.

A WCF támogatja még a „megbízható” (reliable) üzenetküldési mintákat is. Ezek:

  • AtLeastOnce: legalább egyszer – az üzenetnek legalább egyszer el kell érnie a szervert, sikertelen küldés esetén meg kell ismételni. Ha a szerver visszaigazolása késik, közben a küldő újra próbálkozhat a küldéssel, így ugyanazon üzenet többször is elérheti a szervert (többször meghívja a függvényt)

  • AtMostOnce: legfeljebb egyszer – az üzenet elképzelhető, hogy nem éri el a szervert, de ha igen, legfeljebb egyszer éri el (0 vagy 1 alkalommal hívja meg a függvényt)

  • ExactlyOnce: pontosan egyszer – az üzenet legalább és legfeljebb egyszer érheti el a szervert.

  • InOrder: sorrendben – több szálon futó (de akár egy szálon is érdekes) kliens esetén a szerver felé küldött üzenetek pontosan abban a sorrendben kell, hogy beérkezzenek, amilyen sorrendben a kliens elküldte őket.

A WCF technológia állandóan lépést tart a protokollszabványok fejlődésével, alkalmazza a legújabb adat-, illetve üzenetátviteli titkosítási eljárásokat. Nem csak .NET Framework fejlesztésű programok összekapcsolására alkalmas, hanem idegen programozási nyelveken megírt és idegen platformokon működő alkalmazásokkal is képes együttműködni. Használata nagymértékben növeli az elosztott alkalmazások tervezésének, fejlesztésének, tesztelésének idejét.



[38] negyedikként a Windows CardSpace-t

[39] user interface

[40] application logic

[41] SoC: Separation of Concerns

[42] ezt horizontális felosztásnak nevezik. Másik lehetséges felosztás a vertikális, amikor egy programozó team egy adott modul fejlesztésére koncentrál, a modul mindhárom rétegbeli képét ők implementálják

[43] chunk

[44] service bus

[45] content enricher

[46] message routing

[47] protocol bridging

[48] message filters

[49] dispatcher

[50] channel-stack

[51] Representational State Transfer

[52] Peer Name Resolution Protocol

[53] Microsoft Message Queue

Zárszó

Ebben a jegyzetben áttekintettük a hagyományos (szekvenciális), a párhuzamos és az elosztott alkalmazások fejlesztésével kapcsolatos problémákat, alapfogalmakat.

A párhuzamos programozás hardverigénye ma már hétköznapi, asztali gépekben is felbukkan a több processzormag alkalmazása. Láthattuk, hogy a többszálú működés a tervezést is egyszerűsítheti, amennyiben a programnak egy időben több tevékenységet kell végeznie.

A párhuzamos programok előnye (és egyben hátránya is), hogy a szálak közötti kommunikáció egyszerű, mivel minden szál ugyanazon programhoz tartozik, a közös változókon keresztül osztozhatnak az adatokon. Problémás azonban felfedezni, mikor kerül bele egy változóba a kívánt érték, mikor válik az használhatóvá más szálak részére. Megoldást kínál erre a problémára a termelő-fogyasztó problémában is ismertetett módszer, amikor nem egy skalár, hanem egy összetett típusú változóba (pl. lista, sor, verem) helyezzük el az értékeket. Ezen (de nem csak ezen) típusú változók nem thread-safe jellemzőjűek, nem képesek egy időben több szálat kiszolgálni, így használatukhoz kizárólagosságot kell igényelni. Ezt egyszerű esetben a lock, összetettebb esetben a Monitor osztály metódusaival tudjuk kivitelezni. A szálak indítását, az állapotok lekérdezését, a szálak közötti szinkronizálást a Thread osztály példányainak metódusaival végezhetjük el.

Az elosztott programozás esetén olyan programok kívánnak egymással kommunikálni, amelyek fizikailag különböző számítógépeken futnak. Természetesen megoldható, hogy szimuláljuk ezt a viselkedést egyetlen gépen futó – de ezen szempontból ugyanúgy különbözőnek tekintendő – programokkal. Mindkét esetben a programok elkülönült memóriaterületen gazdálkodnak, így az adatok cseréje csak üzenetküldésekkel valósítható meg.

Bemutattunk néhány algoritmust, problémát, melyek mind párhuzamos, mind elosztott működés esetén előfordulhatnak.

A programok üzenetküldéseivel kapcsolatosan sok a probléma. Még az egyszerű adattípusok sem feltétlenül azonosak a különböző programozási nyelvek között, az összetett adattípusok esetén pedig egészen nagyok lehetnek az eltérések. Az adatok küldése és fogadása során szerializációs, deszerializációs lépéseket kell tenni. Ezek kevésbé terhelik a processzort, ha bináris az adatküldés, és jelentős plusz munkát jelent, ha string- vagy XML-alapú a kommunikáció. A bináris működés csak azonos platformok összekapcsolása esetén jelenthet alternatívát, míg a string vagy XML esetén különböző programnyelveken megírt programok, platformok is képesek lehetnek egymással kommunikálni.

Magát a kommunikációs módszerek megismerését az alapszintű, streamalapú kommunikációval kezdtük, tudomásul véve, hogy minden más módszer is ezen az alapszinten működik. A küldés-fogadás megismerkedése után bemutattuk, hogyan lehet több klienssel kapcsolatot fenntartó szervert tervezni, készíteni.

Magasabb szintű működést érhetünk el, ha nem streamalapú, hanem RPC-szintű módszereket alkalmazunk. Ennek során bemutattuk az automatizmust, a példányok és a hívások lehetséges kapcsolatát (singlecall, singleton). Ekkor kerültek előtérbe a szerializációs problémák. Bemutattuk, hogyan lehet mégis elérni a kliensekhez rendelt egyedi példányok készítését, vagy ezt pótolni a munkamenet (session) kezelésével. Az RPC mindkét oldalán felfedezhető egy igény, hogy a szerver és a kliens is azonos típusinformációval rendelkezzen, amit legkönnyebben DLL-be helyezett interfész segítségével érhetünk el. Ez a WCF-ben bemutatott szerződés előfutára. Hasonlóan, itt került bemutatásra a proxy osztály, mint a kliens oldali átlátszóság egyik fontos eszköze.

A másik magasabb szintű működés a webszolgáltatás, ahol a szerver kódját a webszerver (IIS) pótolhatja. A webszolgáltatások kapcsán az egyedi példányok kevésbé megoldhatóak, inkább a munkamenet használata a jellemzőbb. Ehhez automatikus támogatást ad a webszolgáltatást támogató alrendszer.

A webszolgáltatások kapcsán ismerhettük meg a WSDL leírás fontosságát, mely szükséges abból a szempontból, hogy különböző platformok összekapcsolása felé nyissunk. A WCF is használhatja ugyanezen módszert a szolgáltatással kapcsolatos információk szerver és a kliens közötti megosztására.

A WCF használatakor széles körben választhatunk előre definiált protokollok közül, és sajátot is kialakíthatunk. Újragondolt XML-szerializációt használhatunk. A szolgáltatás címzéséhez a jól bevált url módszert alkalmazhatjuk. A WCF motor a bejövő hívás és a példányok összekapcsolására jóval szélesebb lehetőségeket tartalmaz, mint az RPC.

A WCF fontos részét képezi az alkalmazáshoz tartozó külső konfigurációs fájl automatikus használata, melynek előnyeit elsősorban szerver oldalon, de akár kliens oldalon is élvezhetjük. Nemcsak a kapcsolat paramétereit helyezhetjük itt el (beleértve a címet, a kötés típusát), de titkosítási beállításokat, naplózást és teljesítményelemzéshez szükséges mérési előírásokat is. Mindezekkel tehát a programok tervezése és kódolása során nem kell törődnünk, ezek kezelése maga a WCF motor feladata.

A WCF tehát igen átgondolt, szélességében igen kiterjedt, sok aktuális szabványt támogat, mind protokollok, mind titkosítási eljárások terén. A rá eső munkát könnyedén átvállalja, a fejlesztők koncentrálhatnak a szolgáltatás fejlesztésével kapcsolatos munkákra.

Meg kell jegyeznünk, nem a WCF az egyetlen megoldás ezen problémákra. A Microsoft világán kívüli kezdeményezés a CORBA, Common Object Request Broker Architecture, mely több, komoly ipari erőt képviselő cég tömörüléséből fakadó szabványok gyűjteménye. A Microsoft sajnos nem része ennek a csoportnak, így a .NET Frameworkben nincs gyári támogatás a CORBA kommunikációs protokollok felé (a WCF-ben sincs). Független helyről letölthető ilyen támogatás, az interneten kis keresgéléssel.

Szintén érdekes kezdeményezés még az ICE, Internet Communications Engine, mely egy független társaság, a fejlesztése (http://zeroc.com). Ez egy több nyelvhez implementált támogatás, nagy sebességű kommunikációt ígér, használata nem bonyolultabb, mint amit az RPC során ismertettünk.

Az elosztott működés a számítási felhők megjelenésével a jövőben csak bővülni fog. A gyenge hardverfelszereltségű mobil eszközök rohamos terjedésével egyre több számítási feladat kerül át nagy teljesítményű szerverek vagy szerverfarmok felé. Figyeljünk a tendenciára: eddig is érdemes volt ezen technológiával foglalkozni, de a jövőben a hangsúly is egyre nagyobb lesz. Egy igazi programozónak nem szabad ezt a területet ismeretlenül és kiaknázatlanul hagyni.

Reméljük, a jegyzet segítséget nyújt a módszerek minél rövidebb megismerésében, a példák és az ábrák pedig segítenek az első lépések gyors és sikeres leküzdésében. Sok sikert és örömet kívánunk a programozási ismereteink ez irányú fejlesztéséhez!

A szerző

Köszönetnyilvánítás

A szerző ezúton szeretne köszönetét kifejezni a könyv lektorának, Pócza Krisztiánnak, aki építő jellegű, hasznos észrevételeivel, gyakorlati tapasztalataival, a témakörbe eső széleskörű látásmódjával nagyban segítette a jegyzet végső formára hozását.

Irodalomjegyzék

[1] Flynn, M., Some Computer Organizations and Their Effectiveness, IEEE Trans. Comput., Vol. C-21, pp. 948, 1972.
[2] M. J. Flynn: Very high-speed computer systems. Proceedings of the IEEE 5(6) 1966, 1901.1909. 6.1
[3] Pablo Cibraro, Kurt Claeys, Fabio Cozzolino, Johann Grabner, Professional WCF 4, Windows Communication Foundation with .NET 4 Wiley Publishing, Inc. 2010, ISBN- 978-0-470-56314-4
[4] Pro WCF, Practitcal Microsoft SOA Implementation, Chris Peiris, Dennis Mulder, Shawn Cicoria, Amit Bahree, Nishith Pathak, APress, 2007, ISBN: 978-1-55059-702-6
[5] Fóthi Ákos, Horváth Zoltán: Bevezetés a programozásba, ELTE Faculty of Informatics, (Oktatási Minisztérium támogatásával), ISBN: 963 463 757 4, ELTE IK Elektronikus Könyvtár, http://people.inf.elte.hu/ekonyvtar, 2005
[6] Horváth Zoltán: Párhuzamos programozás alapjai, Különálló része a digitális kiadványnak, ELTE Faculty of Informatics, (Oktatási Minisztérium támogatásával), ISBN: 963 463 757 4, ELTE IK Elektronikus Könyvtár, http://people.inf.elte.hu/ekonyvtar, 2005
[7] David S. Platt: Introducing MicrosoftŠ.NET Microsoft Press, April 2003, ISBN: 9780735619180
[8] Matthew MacDonald: MicrosoftŠ.NET Distributed Applications: Integrating XML Web Services and .NET Remoting, Microsoft Press (March 26, 2003) ISBN: 978-0735619333
[9] CommonObject Request Broker Architecture: Core Specification December 2002 Version 3.0 - Editorial update
[10] http://zeroc.com/index.html, Internet Communication Engine honlapja, 2010
[11] Dijkstra, Edsger W.: Cooperating sequential processes (EWD-123). E.W. Dijkstra Archive. Center for American History, The University of Texas at Austin. (September 1965)
[12] Dr. Pócza Krisztián, ELTE IK, A .NET Framework és Programozása tárgy oktatási honlapja, http://avalon.inf.elte.hu/edu/net/default.aspx.