Feladat: I.507 Korcsoport: 18- Nehézségi fok: átlagos
Füzet: 2020/március, 164 - 165. oldal  PDF  |  MathML 
Témakör(ök): Feladat, Programozás, algoritmusok

A szöveg csak Firefox böngészőben jelenik meg helyesen. Használja a fenti PDF file-ra mutató link-et a letöltésre.

A honlapok látogatottságáról a webszerverek legtöbbször naplót vezetnek. Az általunk vizsgált weboldal naplójából részletek találhatók a webstat.txt szöveges állományban. A napló időrend szerint rendezett, egy-egy sorában egy látogatás adatai szerepelnek:

a használt böngésző neve, vagy egy kötőjel, ha a böngésző típusa nem volt megállapítható;
a böngészés dátuma (minden dátum 2020. februári);
a weboldalt felkereső kliensszámítógép IP-címe;
amennyiben a látogató az oldal címét beírva kereste föl a weboldalt, akkor a ,,honlap'' szó, egyébként annak a weboldalnak vagy alkalmazásnak a címe, ahonnan hivatkozással a honlapra került a látogató.

A szöveges állományban a fenti adatokat szóköz választja el a mintának megfelelően:
 
Chrome 2020.02.11 130.43.220.233 www.google.comFirefox 2020.02.11 134.255.106.38 www.google.comSafari 2020.02.11 134.255.91.250 honlapSafari 2020.02.11 146.255.156.230 www.google.hu   
 

Készítsünk programot, amellyel megoldjuk a következő feladatokat. Minden feladatrész elkészítésekor írjuk ki a feladat sorszámát (pl. 1. feladat:), valamint a beolvasás és a kiírás formátumát a minták alapján oldjuk meg. Az ékezetmentes kiírás is elfogadott.
1.Olvassuk be és tároljuk el a webstat.txt állományt, majd adjuk meg, hogy hány adatsor szerepel a naplóban. Például: A beolvasott sorok száma: 300.
2.Adjuk meg táblázatos elrendezéssel, hogy az egyes napokon hány látogató adatai szerepelnek a naplóban. Például: 2020.02.11   59 látogató.
3.Soroljuk fel azokat a böngészőket, amelyek szerepelnek a naplóban. A listában minden név egyszer szerepeljen és a neveket vesszővel válasszuk el. Például: A böngészők: Chrome, Firefox, Safari, Edge, Opera.
4.Adjunk statisztikát arról, hogy a honlapot Chrome böngészővel felkeresők hogyan érték el a weboldalt. Számítsuk ki, hogy hány százalékuk adta meg a honlap címét, illetve hány százalékuk jött máshonnan a honlapra. Az eredményt egy tizedesjegyre kerekítve írjuk ki, például:
 
www.google.com:50.5%honlap:44.7%android-app:2.1%kereso.startlap.hu:0.5%www.google.hu:1.1%hu.m.wikipedia.org:1.1%   
 

5.Vizsgáljuk meg az adatokat, és adjuk meg azokat az IP címeket, amelyekről egy adott napon többször is fölkeresték a weboldalt. A listában minden IP-cím csak egyszer szerepeljen. Az eredményt az alábbi formában adjuk meg:
Amely címekről többször is jártak az oldalon egy adott napon: 176.63.29.84, 176.63.7.203, 188.156.108.17 ...
6.Kérjünk be egy IP-címet, és adjuk meg, hogy mely napokon keresték föl a weboldalt a bekért címnek legalább az első két bájtjával azonos címekről. Készítsünk egy szöveges állományt, amelybe soronként megadjuk a talált napokat és IP-címeket a napló szerinti sorrendben. Az állomány neve a bekért IP-címből épüljön fel úgy, hogy a címben szereplő pontok helyére az aláhúzásjel kerüljön, és a kiterjesztése txt legyen.

Beküldendő egy i507.zip tömörített állományban a program forráskódja és egy rövid leírás, ami megadja, hogy a forrásállomány melyik fejlesztői környezetben fordítható.