Od jakiegoś czasu zastanawiałem się jakie plusy i minusy ma wzór, na podstawie którego tworzone są rankingi FW. Korzysta się z niego przy tworzeniu rankingów filmy (Top 100) i seriale (z możliwością wyszukiwania wg kraju, gatunku i lat), gry (dodatkowo z wyszukiwaniem wg platformy), nowości oraz ludzie filmu z podziałem na poszczególne kategorie. Aktualizowane są one raz dziennie, jeśli dobrze zdążyłem zauważyć ok. 4 nad ranem. Wziąłem więc ten wzór na tapetę... Przedstawia się on następująco:

średnia ważona = (g / (g+m)) * s + (m / (g+m)) * S
gdzie:
s - średnia ocena dla danego filmu
g - liczba oddanych głosów na film
m - minimalna liczba głosów wymagana do uwzględnienia w TOP (dla filmu i osób 1000, dla serialu 100, dla gier 25)
S - średnia ocen dla wszystkich filmów

Jak widać mamy tu cztery zmienne wartości wkomponowane we wzór, który składa się z sumy dwóch iloczynów (wyników mnożenia). Jeśli ktoś nie chce przechodzić przez poszczególne etapy rozwiązywania tego równania proponuję przejść do podsumowania ;). Dla pozostałych:

1a. Zajmiemy się najpierw drugim iloczynem. Ta część równania wygląda tak: (m / (g+m)) * S. Na początek wartość 'S'. Jest to średnia ocen dla wszystkich filmów. Domyślać się należy, że wszystkich zawartych w rankingu, a więc tych produkcji kinowych (nie wideo czy TV), których liczba ocen przekracza 1000. Na dzień dzisiejszy jest to zdaje się 6757 pozycji. Miejsce wartości 'S' w równaniu sprawia, że średnia ważona danego filmu ma większe odwzorowanie w porównaniu ze średnią reszty filmów z rankingu, a mówiąc prościej szybciej zbliża się do tej średniej. Wartość ta nie jest konieczna, właściwie nie jest nawet potrzebna cała druga część iloczynu, kluczowy jest bowiem pierwszy iloczyn. Została ona dodana aby pomóc wywindować wyżej w rankingu film, który przekroczył dopiero wymagane 1000 głosów, jeśli oczywiście znajdą się osoby, które będą chciały go nadal oglądać. Ile wynosi wartość 'S'? Jest to na pewno wartość najbardziej stała spośród wszystkich w równaniu. Przykładowo średnia przeze mnie ocenionych filmów wynosi 6.6, zauważyłem również, że wielkość ta jest podobna u wielu użytkowników, u których wykres z ocenami da się podglądnąć (najczęściej między 6 a 7). Należy się domyślać, że jest tu ona zawyżona, ponieważ bardziej skłonni jesteśmy oglądać filmy lepsze, natomiast te gorzej oceniane przez innych (a jednak pozostające w rankingu) staramy się raczej pomijać. To ile faktycznie wynosi ta wielkość wie pewnie tylko ten, kto ma dostęp do raportów generowanych przez skrypt cz też logarytm na serwerze FW. Mogę przypuszczać że wynosi on ok 6. Przy tym nie tyle jest ważne ile on wynosi (np. 5 czy 7) ale to że składnik ten w ogóle istnieje w równaniu. Z ciekawości bawiłem się zmieniając jego wartość i różnice nie były znaczące.

1b. Tym mniejsze są one im więcej osób obejrzało film, ponieważ wartość 'S' w drugiej części równania mnożymy przez m / (g+m). I o tym składniku teraz mowa. Wartość 'm' wynosi 1000 i jest to pewnego rodzaju kompromis pomiędzy braniem pod uwagę możliwie wielu produkcji, a oczywistym ryzykiem zaburzenia rankingów przez filmy skrajnie oceniane przez niewielką liczbę userów. Wartość graniczna musi istnieć, inaczej ranking Top 100 zdominowany byłby przez filmy ocenione na 10 przez jednego użytkownika. Można się jednak zastanawiać na jakiej wartości ta granica powinna być postawiona. Moim skromnym zdaniem jest we właściwym miejscu, ale można się oczywiście o to spierać. Podstawiając za 'm' liczbę 1000 otrzymujemy 1000 / (liczba głosów + 1000). W praktyce wygląda to następująco dla liczby głosów równej odpowiednio (w tysiącach) 1, 5, 10, 50, 100, 500 (tymi wielkościami liczby głosów będę się posługiwał): 0.5, 0.17, 0.09, 0.02, 0.01, ~0. Widzimy więc, że im więcej głosów oddanych na dany film, tym wpływ tego czynnika, a więc i całej drugiej części równania po pomnożeniu przez 6 jest mniejszy. Po tym pomnożeniu otrzymamy odpowiednio dla powyższych ilości głosów: 3, 1, 0.55, 0.12, 0.06, 0.01. O tyle więc jeśli wpływ drugiego elementu sumy w naszym równaniu jest spory dla filmów o małej ilości oddanych głosów (powiedzmy do 10 tysięcy), o tyle dalej właściwie zanika (powiedzmy powyżej 50 tysięcy).
___

2a. Mamy więc drugi element sumy w równaniu. Teraz zajmijmy się pierwszym (nie ma co ukrywać - ważniejszym). Jest on wynikiem mnożenia: (g / (g+m)) * s. Kluczowy jest tu czynnik 's', czyli czysta średnia ocena filmu, widoczna na stronie głównej filmu. Jest to najprostszy składnik, nad którym nie ma co się zatrzymywać. Można jedynie zaznaczyć, że średnia wyświetlana na portalu jest z dokładnością do jednego miejsca po przecinku (zapewne dla wygody), ale z pewnością dokładność ta jest większa podczas obliczania średniej ważonej. Dla rozwiązania równania podobnie jak przy wartości 'S' musimy podstawić jakąś liczbę. Jeśli ma to być film na znacznej pozycji w rankingu musi być ona odpowiednio wysoka. Powiedzmy, że czysta średnia ocena danego filmu wynosi 8.0.

2b. Wartość 's' mnożymy przez wynik dzielenia g / (g+m), czyli liczba głosów / (liczba głosów + 1000). Umieszczenie czynnika 'g' po tej stronie równania, gdzie jest pomnożony przez najważniejszy czynnik 's' sprawia, że jego wpływ jest spory, ale znowu przy małej liczbie oddanych głosów, a maleje kiedy głosów jest więcej. Dla znanych nam już wartości oddanych głosów wynik tego dzielenia będzie wyglądał następująco: 0.5, 0.83, 0.91, 0.98, 0.99, ~1. Mnożąc te wyniki z przyjętą przez nas średnią danego filmu (8) otrzymamy pierwszą część równania równą: 4, 6.67, 7.27, 7.84, 7.92, 7.98. Jak widać dla naszego przykładowego filmu wynik pierwszej części równania gwałtownie rośnie zwłaszcza do 5 tysięcy, a następnie trochę już wolniej aż do powiedzmy 50 tysięcy, gdzie się powoli zatrzymuje, podobnie jak to było w drugiej części równania.


PODSUMOWANIE:
Dodajmy więc oba wyniki mnożenia uzyskując dla poszczególnych ilości oddanych głosów (1, 5, 10, 50, 100, 500 tysięcy), przy filmie ocenionym na ósemkę i średniej ocenie wszystkich filmów w okolicach szóstki wynik będący średnią ważoną: 7, 7.67, 7.82, 7.96, 7.98, 7.99.
Wnioski są proste: oba składniki sumy dopełniły się w ten sposób (ściślej mówiąc drugi dopełnił pierwszy), że zachowana została zasada bonusowych punktów dla filmów które dopiero co przekroczyły próg 1000 głosów (i zdobywają nowe głosy) i bonusy te są one znaczne aż do ok 50 tysięcy głosów, ale jednak nie tak znaczne jak byłyby one, gdyby nie wartości z drugiej części równania czyli średnia z wszystkich filmów i granica 1000 głosów.

Dzięki temu łatwo zrozumieć fenomen niektórych popularnych filmów (na nich najlepiej widać wpływ tego wzoru na pozycję filmu w rankingu) takich jak Hobbit (doszedł szybko do 37 miejsca by spaść w ciągu dwóch tygodni do 57 pozycji, gdzie się zatrzymał) czy Django (już na 12 pozycji, kiedy jeszcze dziesięć dni temu nie było go w pierwszej setce). Jednym z powodów takiego stanu rzeczy jest oczywiście czynnik psychologiczny (wyższe oceny dla seansów kinowych niż na ekranie komputera, jako pierwsi oglądają wierni fani Tolkiena czy Tarantino i inne). Drugim powodem jest jednak sam wzór, który premiuje film dzięki ilości ocen aż do pewnej płynnej granicy (moim zdaniem można umownie ją postawić na 40-50 tysiącach), po czym coraz ważniejsza w porównaniu z ilością ocen staje się sama czysta średnia wystawiona przez użytkowników FW (nawiasem mówiąc IMDB również korzysta z tego wzoru). Dopiero wtedy widać po tym czy film utrzymuje się na swoim poziomie czy spada jakie faktycznie są jego oceny, przestaje bowiem działać efekt bonusa w postaci liczby głosów. Prawdziwie wysoko oceniane są więc filmy, które pozostają wysoko mimo, że obejrzało je już 100 czy 300 tysięcy osób. Przykładem do porównania mogą być filmy "Porachunki" i "Zapach kobiety", oba mające średnią ważoną równą 8,082 i zajmujące w rankingu miejsca obok siebie (55 i 56) a także powstałe w podobnych latach (ważne odnośnie ilości głosów). Pierwszy z nich ma jednak 46 tysięcy głosów, drugi natomiast 176 tysięcy. Należy stąd wnioskować, że wzór premiował w tym przypadku ten pierwszy film.
Po jakimś czasie ilość oceniających przestaje rosnąć w takim tempie jak poprzednio (liczba widzów jest ograniczona), same oceny stają się mniej skrajne (zarówno te bardzo wysokie jak i te bardzo niskie) i film ustala się na pewnym w miarę stałym poziomie. Przypomina to sinusoidę o coraz mniejszej amplitudzie.

Czy wzór ten jest sprawiedliwy i czy w ogóle jest potrzebny, czy potrzebne są rankingi? Kwestia dyskusyjna. Moim zdaniem jeśli rankingi uzna się za przydatne, to wzór który tu się stosuje jest niezły. Co do samych rankingów czasami się przydają kiedy szuka się potencjalnie dobrego filmu zwłaszcza z zastosowaniem filtrów. Z drugiej strony pozycja filmu w rankingu nie powinna mieć chyba jakiegoś znacznego wpływu przy wystawianiu oceny. Jak uważacie?

użytkownik usunięty
Wpis został zablokowany z uwagi na jego niezgodność z regulaminem

Normalnie jak na matematyce w szkole się czuje...

użytkownik usunięty
Walka_dalej_trwa

Ja też, może cię pocieszy, że na matmie miałem same mierne ;)

Zrób podsumowanie podsumowania, to może ktoś to przeczyta.

użytkownik usunięty
GOLONEK

He he, fakt ;) Z drugiej strony pisałem głównie dla siebie żeby gdzieś zapisać te obliczenia i zapamiętać wnioski. Umieściłem na forum dla nielicznych bardzo zainteresowanych i wytrwałych.

O kurde, przeczytałem całość dwa razy i rozbolała mnie dynia. Niezłą rozkminke sobie wkręciłeś.
Szacuneczek...

Twoje wypociny są imponujące i w wolnej chwili z wielką chęcią je sobie przyswoję, ale w tym momencie nurtuje mnie bardzo jedna kwestia: Co oznacza enigmatyczne rozwinięcie skrótu "S", które brzmi - "średnia ocen dla wszystkich osób dla tego zawodu". Gdzie to niby można znaleźć?

użytkownik usunięty
qoobson41

Oznacza to samo, co dla rankingu filmów "średnia ocen dla wszystkich filmów". Dotyczy go powyżej akapit 1a, tyle że w miejsce słowa 'film' należałoby wstawić 'zawód' (np. aktor, reżyser, scenarzysta, producent itd.)

Wspaniałe wypracowanie, ale naprawdę szkoda, że w pewnym momencie matematyka nie była już obowiązkowym przedmiotem na maturze.

Wzór uśrednia filmy które mają mało głosów do średniej oceny wszystkich filmów.

Czyli film który ledwo się pojawił w rankingu jest uśredniany gdzieś w okolice 6 w takim stopniu jak (ilość jego ocen / minimalnej liczby ocen do znalezienia się w rankingu).

W rzeczywistości wygląda to nastepuyjąco:

* Film chodzi do rankingu ze średnią bliską 10, bo głosowali na niego tylko fani.
* Wzór go uśrednia w strone około 6.
* Następnie coraz więcej osób go ogląda i ocenia i jego średnia ważona rośnie.
* Jak już jest za wysoko w rankingu to zabierają się za niego trolle i ocena spada.

Dziękuje za uwagę.

Kristof

A jakby wyglądał Filmweb, gdyby to informatyka była obowiązkowa!

Kristof

Jako osoba - jak rozumiem - współodpowiedzialna za działanie jednego z najbardziej zbugowanych i niefunkcjonalnych portali w polskim Internecie, powinieneś - tak myślę - dwa razy się zastanowić, zanim zaczniesz wyśmiewać czyjąś niekompetencję.

użytkownik usunięty
Kristof

Jakieś dwa lata temu FW zmienił wartość czynnika "m" i nie wynosi już on 1000, ale 10 000. Zaburzyło to wtedy zupełnie ranking. Głównym efektem było to, że wypadły z niego filmy bardzo wysoko oceniane, ale nie tak popularne, filmy bardzo ambitne. Zamiast nich wskoczyły głupawe komedyjki i łatwe w odbiorze sensacje. Według mnie był to błąd, bo nie ma to być ranking filmów popularnych, ale dobrych, najlepszych.
Na dzisiaj, aby film wszedł do rankingu musi mieć średnie w granicach:
8,0 przy min. 18 tys. głosów
7,9 przy min. 20 tys. głosów
7,8 przy min. 23 tys. głosów
7,7 przy min. 29 tys. głosów
7,6 przy min. 37 tys. głosów
7,5 przy min. 64 tys. głosów
7,4 przy min. 134 tys. głosów

Kristof

Haha, dobre.

Pobierz aplikację Filmwebu!

Odkryj świat filmu w zasięgu Twojej ręki! Oglądaj, oceniaj i dziel się swoimi ulubionymi produkcjami z przyjaciółmi.
phones