VoteBroker Devlog — 19. Juni 2026

in #votebroker2 days ago

VoteBroker Devlog — 19. Juni 2026

Änderungen seit: 16. Juni 2026


Im letzten Devlog hieß es: „Ab morgen früh wissen wir die Antwort auf die eigentlich interessante Frage — waren die Ablehnungen richtig?"

Inzwischen ist dieser Moment eingetreten. Zum ersten Mal liegen aufgelöste Entscheidungen vor: Posts, die der CoPilot bewertet hat, deren 7-Tage-Auszahlungsfenster abgelaufen ist und deren finaler Payout nun feststeht.

Und die ehrliche Antwort lautet: Der CoPilot war gut — aber nicht aus den Gründen, die wir vermutet hatten. Genau das hat die letzten Tage geprägt.


Ein zweites Modell, das die Daten ernst nimmt

Bisher gab es ein Bewertungsmodell — den CoPilot Score, inzwischen in Version v3, am 17. Juni nachgeschärft, um zu großzügige Fehlentscheidungen zu reduzieren.

Seit dem 19. Juni läuft daneben ein zweites, völlig eigenständiges Modell im Shadow Mode: v4. Es ist kein Nachbau von v3. Es löst keinen einzigen echten Vote aus. Es bewertet jeden Kandidaten parallel, schreibt seine Entscheidung Seite an Seite mit v3 in dieselbe Historie — und verfolgt eine einzige Leitidee:

Korrelation ist nicht Kausalität.

Vier Fallen, in die ein naives Modell tappt — und die v4 bewusst entschärft:

  • Der Growth Factor lügt über das Timing. Wie stark ein Post nach unserem Vote noch wächst, hängt auch davon ab, wie früh wir gevotet haben — nicht nur von der Qualität des Posts. Ein timing-verzerrtes Signal kann keine Qualität messen. v4 benutzt es deshalb gar nicht.
  • Autorqualität ist nicht Wal-Aufmerksamkeit. v4 misst die Qualität eines Autors am Median seiner bisherigen Auszahlungen — robust gegen einzelne, von Walen aufgeblähte Ausreißer. Wale zählen nur als zusätzliche Bestätigung, nicht als Definition von Qualität.
  • Poolgröße ist nicht Postqualität. Dass ein Post „billig" ist (wenig Pending-Payout), war im alten Modell der größte Treiber von Fehlentscheidungen. Ein kleiner Pool heißt meist nur: kleiner, neuer Post — nicht: guter Post. v4 gibt diesem Signal null Gewicht.
  • VP-Einsatz ist nicht Erfolg. v4 bewertet ausschließlich die Qualität einer Chance, unabhängig davon, wie viel Stimmgewicht ein Vote hätte.

Statt harter Punkte-Schwellen gibt v4 eine Wahrscheinlichkeit aus: Wie wahrscheinlich ist es, dass sich dieser Post am Ende gelohnt hätte?


Der erste echte Vergleich: v4 gegen v3

Hier wird es spannend. Weil beide Modelle dieselben Kandidaten bewerten und der finale Payout jetzt bekannt ist, konnten wir v4 zum ersten Mal rückwirkend gegen die tatsächlich getroffenen v3-Entscheidungen messen — methodisch sauber, mit nur jenen Informationen, die zum jeweiligen Zeitpunkt verfügbar waren.

Auf 4.959 aufgelösten Entscheidungen:

                  Precision    Fehlentscheidungen (FP)
v3 (wie gelaufen)     ~76 %            1.190
v4 (Forschung)        ~98 %               49

v4 hat fast alle Fehlentscheidungen eliminiert — und die Posts, für die es stimmen würde, zahlten im Schnitt deutlich höher aus (≈ 8,4 statt 6,1 SBD).

Aber — und das ist der ehrliche Teil — das ist kein Gratis-Sieg. v4 ist deutlich wählerischer: Es überspringt auch Posts, die am Ende okay ausgezahlt hätten. Es tauscht Vollständigkeit gegen Präzision. Ob das die richtige Balance ist, hängt davon ab, wie knapp die Voting Power gerade ist. Und der Vergleichsmaßstab war die ältere v3-Variante — gegen das heutige v3 wäre der Abstand kleiner. Es ist ein erster Messpunkt, kein Endurteil.


Die Daten haben uns überrascht

Der erkenntnisreichste Moment kam bei der Frage: Warum übersieht v4 die guten Posts, die es übersieht?

Wir haben jede einzelne dieser verpassten Chancen in Ursachen zerlegt. Das Ergebnis war kontraintuitiv. Der größte einzelne Hebel war nicht das Timing und nicht das Wal-Signal — sondern eine schlichte Voreinstellung:

v4 war zu pessimistisch gegenüber unbekannten Autoren. Wenn keine Historie vorlag, behandelte es den Autor als neutral und übersprang ihn im Zweifel. In den Daten waren genau diese Unbekannten aber überwiegend gut.

Eine einzige Stellschraube — der Standardwert für unbekannte Autoren, von „strikt neutral" auf „leicht wohlwollend" — holte einen Großteil dieser verpassten Posts zurück, praktisch ohne neue Fehlentscheidungen. Genau so soll es sein: Das Modell folgt den Daten, auch wenn das Ergebnis der ursprünglichen Annahme widerspricht. Der Wert ist jetzt konfigurierbar und soll künftig direkt aus realen Auszahlungen gelernt werden.

Und weil Transparenz zählt: Im Admin-Dashboard stehen die Werte von v4 nun direkt neben denen von v3 — Precision, Recall, Confusion-Matrix, und für jede Entscheidung sichtbar, ob echte Autor-Historie oder die Voreinstellung verwendet wurde.


Außerdem: Das Dashboard hält jetzt Schritt

Ein im Alltag spürbares Update. Die Kachel „Offene Chancen" aktualisiert sich jetzt von selbst — beim Öffnen des Dashboards, bei der Rückkehr in die App, bei veralteten Daten und laufend, solange das Dashboard offen ist. Vorher tauchten neue Chancen oft erst nach einem Wechsel in den DNA-Tab auf. Wer auf dem Dashboard bleibt, sieht neue Gelegenheiten jetzt zuverlässig, ohne den Tab zu wechseln.

Dazu kamen unter der Haube: ein gemeinsamer Post-Cache, der den Opportunity-Scan im schlimmsten Fall von rund 300 auf etwa 48 Sekunden verkürzt, und ein Aufräum-Job, der die wachsende Datenbank schlank hält — ohne je ein gültiges Signal zu löschen.


Community-Aktivität

Seit dem letzten Devlog (16. Juni) hat VoteBroker 185 Votes für 51 Autoren ausgeführt. Einziger aktiver Kurator derzeit: @jan-philippvieth.

16. Juni (nach Veröffentlichung): 36 Votes · 32 Autoren — u.a. @welako-history, @happycapital, @trafalgar, @un-stoppable, @thinking.element

17. Juni: 58 Votes · 42 Autoren — u.a. @kafio.wit, @welako-history, @udabeu, @realrobinhood, @lotto4you, @ini4909

18. Juni: 46 Votes · 33 Autoren — u.a. @indextrader24, @welako-history, @blackeyedm, @happycapital, @abi24, @winkles

19. Juni (laufend): 45 Votes · 40 Autoren — u.a. @welako-history, @solperez, @happycapital, @winkles, @un-stoppable


Was als Nächstes kommt

  • v4 live messen — bisher ist der Vergleich rückwirkend. Jetzt läuft v4 mit, schreibt seine Entscheidungen mit, und in einigen Tagen kommen die ersten live aufgelösten Outcomes für einen fairen Vergleich gegen das heutige v3.
  • Den Autor-Prior lernen statt setzen — die wohlwollende Voreinstellung für Unbekannte soll künftig direkt aus realen Auszahlungen kalibriert werden, statt von Hand gewählt zu sein.
  • Wachstum verstehen, nicht nur Timing — die eigentliche Forschungsfrage bleibt: Welche Kombination aus Autor, Community und Zeitpunkt erzeugt echte Curation-Kaskaden — und welche verpuffen?
  • Weight vs. Rshares — die Modellentscheidung fällt, sobald genug realisierte Votes vorliegen.

VoteBroker — Community Curation auf Steem · votebroker.org