msgbartop
Weblog, který píše Ondřej Baar o internetovém marketingu, copywritingu a SEO, aby pomohl všem co mají zájem o pomoc
msgbarbottom



Kudy se vydava a co chysta Seznam.cz 4. dil

Publikováno: 20. Leden 2009

Seznam článků:

  1. Kudy se vydava a co chysta Seznam.cz 1. dil ( zadani 1. – 5. )
  2. Kudy se vydava a co chysta Seznam.cz 2. dil ( zadani 6. – 10. )
  3. Kudy se vydava a co chysta Seznam.cz 3. dil ( zadani 11. – 20. )
  4. Kudy se vydava a co chysta Seznam.cz 4. dil ( zadani 21. – 24. )

Tento clanek je pokracovanim meho clanku na tema co chysta Seznam.cz 3. dil. Kvuli rozsahlosti tematu, jsem si dovolil rozdelit jej na vice casti. Tato cast je jiz posledni a pokud jste dosli az sem a precetli vsechny predesle Gratuluji Vam, jiste to nebylo nic lehkeho. Ceka Vas jiz jen rozbor ctyr poslednich bodu zadani Seznamu a zaverecne zamysleni. Clanky jsem psal skoro 2 hodiny a z puvodniho zameru vytvoreni kratke Glosy, jsem byl nucen formu prehodnotit hlavne proto, ze zadani se jiste budou menit a tak jsem je radeji prekopiroval do meho clanku. Kvuli clanku jsem pridal take dalsi rubriku Budoucnost. A nyni jiz k dokonceni meho rozboru.

21. Segmentace HTML dokumentu na logické části

Zadání: Na webových stránkách je vždy část obsahu, která se opakuje (hlavička, menu, atd…) a část obsahu, která je unikátní (content). Opakující části jsou si často podobné, ale téměř nikdy nejsou úplně stejné. Účelem práce je rozdělit stránku na tyto části a u jednotlivých částí určit, o jakou část jde. Hlavní sledovaná veličina je jestli je v konkrétní části unikátní obsah nebo ne.
Muj rozbor: Zde narážíme na snahu oddělit obsah od formy az do dusledku, kdy nakonec zbyde jen forma, na zaklade niz bude fulltexxtovy robot relevanci pridavat prave a jen podle obsahu. OBSAH je kral tuto vetu rikam casto nejen ja, ale jeji pravdivost je cim dal viditelnejsi. Pokud nebudete tvorit kvalitni obsah necekejte, ze Vas budou mit radi vyhledavace natoz uzivatele! Snazte se opravdu tvorit obsah pro uzivatele, bude nejen dobre hodnoceni jimi, ale take vyhledavaci, protoze ty se snazi co nejvice priblizit potreby uzivatelu. Zde rovnez vidime snahu definovat duplicitni obsah. Bohuzel zde narazime take na fakt, ze nas obsah muze nekdo zkopirovat a vyhledavace jej zaregistruji drive u nej, coz se obcas stava. Prukaznost vsak neni jednoducha, a navic ne vzdy je na ne bran ohled. zde uz plati puze pravo prvniho a jedine mozne reseni je zvolit pravni formu protestu a domahani se svych prav. At uz k obsahovemu, multimedialnimu ci jinemu obsahu.

22. AsapSync

Zadání: Cílem je analyzovat současné možnosti pro vzdálenou real-time synchronizaci souborů v režimu Master -> Slave pod operačním systémem Linux. Řešitel by měl navrhnout optimální řešení pro vysokozátežové servery (časté změny na filesystému).
Muj rozbor: Toto zadani koliduje s bodem 10. v druhem clanku A plati pro nej upne to same tedy: „Seznam se cim dale vice potyka s problemem replikace dat, mezi jednotlivymi uzly distribuovaneho systemu, nekdy tyto proniknou az do vysledku vyhledavani, coz jiste nenechava managery Fulltextu Seznamu chladnymi. Pozadavek na distribuci bez sitoveho trafficu mezi uzly, nebo lepe receno dle zadani minimalni, bude asi jen tezko dosazitelny uz vzhledem k obemu a velikosti duistribuovaneho systemu. zarazi me docela take to, ze system by data nemel ukladat vicekrat. Mozna by bylo dobre jeste zvazit vhodny pristup a zda neni pozadavek tohoto typu pro fulltextove vyhledavace zcestny. Podivejme se jak to vyresil Google – spoustou vypocetnich farem, ktere jsou propojeny ridicim mechanizmem. Nerikam, ze toto reseni je nejlepsi, ale rozhodne muze nabidnout minimalne zaklad pro lepsi system alespon co se tyka pohledu energeticke narocnosti a vykonnosti celeho systemu.“ Je zde vsak zamereni na primou replikaci udaju v ramci master slave reseni tedy spise zalohova cast problemu.

23. SQLproxy

Zadání: Tenká transakční protokolová vrstva nad databázovými servery, zajišťující rozkládání zátěže na serverech a poskytující redundanci výkonu a dostupnosti.
Muj rozbor: Dalsi z tridy zadani lepsiho vykonu samotneho vyhledavace a rozdeleni zateze na vice mist, repektive vice datacenter. Je jiste ze fulltext bude obsahovat cim dal vice dokumentu a zatez tak bude dlouhodobe rust a je dobre ze na to Seznam mysli.

24. Sociodemografická analýza uživatelů

Zadání: Vylepšení současné sociodemografické analýzy a nová pravidla. Systém by se mohl samostatně učit a stanovovat další pravidla.
Muj rozbor: Poslednim bodem zadani je spise marketignova kategorie sociodemografickeho rozdeleni uzivatelu. Vize je velmi hezka ale bohuzel na objektivni zhodnoceni zameru a mozne aplikovatelnosti na stavajici analyzu nemam potrebny rozsah informaci, hlavne co se tyce struktury a metodiky aktualni analyzy a pouzitych metrik. Samo ucici se system jsou velmi zajimavou kategorii samo o sobe, myslim si vsak ze bez zasahu cloveka vsak vzdy budou podobne systemy trpet neschopnosti relevantniho urceni objektivnich pravidel, coz ostatne dela problem i lidem. Samozrejme v urcitych oblastech to mozne je, avsak je potreba aby dana problematika byla presne popsana a mela stanovena jasna pravidla, coz u sociodemograficke analyzy castecne plati, ale jde zde spousta vnejsich neobjektivnich vlivu, ktere je treba systemove resit.
Taaak. A mame je tam vsechny jak rekl klasik ( Serie Slunce seno,.. ) … Kdyz se objektivne podivam na vsechny zde zminene body ( 1 – 24 ), mam z nekterych a z nekterych casti velkou radost u nekterych me vsak jima hruza, ktera je zpusobena predeslymi zkusenostmi z rekneme ponekud laxni implementaci Seznamu. Ktery podle me trpi nedstatkem lidskych zdroju a male tendenci dotahnout veci do vysledku a teprve potom reseni novych veci. Implementace po castech v tak sirokem odvetvi jakym je fulltext je podle me spise sebevrazdna, a bylo by podle meho lepsi soustredit se maximalne vzdy na jednu oblast a az po jejim vyreseni se presunout na oblast dalsi. Zde je vsak potreba vhodne stanovit priority vyvoje. Kazdopadne si myslim, ze je dobre videt, ze nektere postoje k fulltextu budou pretrvavat a nektere dale silit… Predevsim tedy analyza a dulezitost predevsim obsahove casti me tesi. Nebot sam tvorim predevsim informacni strany, kterymi chci uzivatelum pomoci.
Tesim se na doufam hojne komentare pod kazdym clankem nad danymi tematy. Dekuji za pozornost a tesim se na Vas me verne ci nahodne ctenare s dalsimi chystanymi clanky.

Komentáře, přidejte svůj názor!

  1. |

    ad 21) Tady jde podle mě jednak o relevanci obsahu – To co je v patičce by asi nemělo být důvodem pro první místo ve fulltextu. A také jde o hodnotu odkazů. Hodnota odkazu z hlavního textu je velká, hodnota z partnerské sekce, lišty, patičky atd. je malá.

    Celkově bych řekl, že i kdyby se podařilo všechny zmíněné body dovést až do úspěšného závěru, odfiltrovalo by to 10% slušných webů a 95% spamů a MFA. Ale pořád tam vidím pár mezer, jak by se to dalo obejít. Otázkou je, co přesně plánují s tím rozdělením shopy blogy newsy. Protože to jsou tři kategorie hodnotného obsahu. To by se dalo zajímavě využít.

  2. |

    Rozhodne bych si pral, aby se vyhledavace dovedly k dokonalosti a nabizely opravdu relevantni vysledky… Kazdopadne zamer je jasny, priblizit se jakozto vyhledavac potrebam uzivatelum, coz by melo reflektovat jejich pozadavky a touhy. Coz pro mne znamena pokracovat ve stale stejne kvalitni praci a testech…

Komentáře, přidejte svůj názor!

You must be logged in to post a comment.

¨