MediaWiki:Gadget-LabelScan.js: Unterschied zwischen den Versionen

Keine Bearbeitungszusammenfassung
Markierung: Zurückgesetzt
Keine Bearbeitungszusammenfassung
 
(71 dazwischenliegende Versionen desselben Benutzers werden nicht angezeigt)
Zeile 1: Zeile 1:
/* global mw, Tesseract */
/* global mw */
(function () {
(() => {
   'use strict';
   'use strict';


   // ========= KONFIG =========
   const CFG = {
  // Wenn du enger in Kategorien suchen willst, trage sie hier ein.
    // ---- Daten & Model ----
  const ADOS_CATEGORIES = [
     indexTitle: (window.LabelScanConfig && window.LabelScanConfig.indexTitle) ||
     'Alle A Dream of Scotland Abfüllungen',
                'MediaWiki:Gadget-LabelScan-index.json',
    'Alle A Dream of Ireland Abfüllungen',
     transformersURL: 'https://cdn.jsdelivr.net/npm/@xenova/transformers@2.15.0',
     'Alle A Dream of... – Der Rest der Welt Abfüllungen',
     modelId: 'Xenova/clip-vit-base-patch32',
    'Friendly Mr. Z Whiskytainment Abfüllungen',
     localModelPath: '/models',         // <<— deine Modelle liegen hier
     'Die Whisky Elfen Abfüllungen',
     'The Fine Art of Whisky Abfüllungen',
    'Alle Rumbastic Abfüllungen'
  ];


  // Wörter, die oft auf ADOS-Labels stehen und uns beim Fuzzy-Match helfen
    topK: 3,                           // <<— MAX. 3 TREFFER
  const KNOWN_TOKENS = [
     maxSide: 1280,                     // Downscale vor Auto-Crop (Performance)
    // Marken/Distilleries (Auszug – erweiterbar)
     'Ardbeg','Ardmore','Arran','Auchroisk','Ben Nevis','Blair Athol','Bowmore',
    'Caol Ila','Clynelish','Glenallachie','Glenrothes','Longmorn','Lagavulin',
    'Tullibardine','Dalmore','Benrinnes','Mortlach','Glenlivet','Inchgower',
    'Bunnahabhain','Springbank','Caperdonich','Linkwood','Glen Scotia',
    // Serien/ADOS-Sprache
    'A Dream of Scotland','A Dream of Ireland','The Tasteful 8','Heroes of Childhood',
    'Cask Strength','Single Malt','Unicorn','Space Girls','Whisky Elfen',
    'The Fine Art of Whisky','Friendly Mr. Z','Rumbastic'
  ];


   // ========= UI HILFSFUNKTIONEN =========
    // ---- Auto-Crop ----
   function hasUI () {
    autoCrop: true,
     return !!document.getElementById('ados-scan-run') &&
    edgeKeepRatio: 0.10,                // oberste 10% Kanten als Maske
          !!document.getElementById('ados-scan-file');
    cropPadding: 0.08,                  // 8% Randzugabe um die Box
    cropMinRel: 0.40,                  // min. 40% der kleineren Bildkante
 
    // ---- Score-Badges ----
    showNumericScore: false,            // true = Zahlen zeigen, false = Badges
    confidenceBands: [0.90, 0.80],      // hoch ≥0.90, mittel ≥0.80, sonst niedrig
 
    // ---- Sonstiges ----
    debug: true
  };
 
   // --------- Helpers ----------
  const log=(...a)=>{ if(CFG.debug) console.log('[LabelScan]',...a); };
  const warn=(...a)=>{ if(CFG.debug) console.warn('[LabelScan]',...a); };
  const err=(...a)=>{ console.error('[LabelScan]',...a); };
  const qs=id=>document.getElementById(id);
  const setStatus=t=>{ const el=qs('ados-scan-status'); if(el) el.textContent=t||''; };
  const setProgress=p=>{
    const bar=qs('ados-scan-progress'); if(!bar) return;
    if(p==null){ bar.hidden=true; bar.value=0; }
    else{ bar.hidden=false; bar.value=Math.max(0,Math.min(1,p)); }
  };
 
   function resetResultsBox(msg){
     const r = qs('ados-scan-results');
    if (r) {
      r.innerHTML = `<div class="empty">${msg || 'Hier erscheinen Treffer.'}</div>`;
    }
   }
   }
  function setStatus (t) {
 
    const el = document.getElementById('ados-scan-status');
   function showPreview(file){
    if (el) el.textContent = t || '';
     const url=URL.createObjectURL(file);
  }
     const prev=qs('ados-scan-preview');
  function setProgress (p) {
     if(prev){
    const bar = document.getElementById('ados-scan-progress');
       prev.innerHTML=`<img alt="Vorschau" style="max-width:260px;width:100%;height:auto;border-radius:8px;display:block;margin:0 auto;" src="${url}">`;
    if (!bar) return;
       prev.setAttribute('aria-hidden','false');
    if (p == null) { bar.hidden = true; bar.value = 0; }
    else { bar.hidden = false; bar.value = Math.max(0, Math.min(1, p)); }
  }
   function showPreview (file) {
     const url = URL.createObjectURL(file);
     const prev = document.getElementById('ados-scan-preview');
     if (prev) {
       prev.innerHTML = '<img alt="Vorschau" src="' + url + '">';
       prev.setAttribute('aria-hidden', 'false');
     }
     }
   }
   }
  const dbg = (msg) => { try { console.log('[LabelScan]', msg); } catch(e){} };


  // ========= TESSERACT WORKER (einmalig) =========
   function base64ToFloat32(b64){
  let workerPromise = null;
     const bin=atob(b64), len=bin.length;
   function ensureWorker () {
     const buf=new ArrayBuffer(len), view=new Uint8Array(buf);
     if (workerPromise) return workerPromise;
    for(let i=0;i<len;i++) view[i]=bin.charCodeAt(i);
     workerPromise = new Promise((resolve, reject) => {
    return new Float32Array(buf);
      if (window.Tesseract && Tesseract.createWorker) {
        const worker = Tesseract.createWorker({
          logger: m => {
            if (m?.status === 'recognizing text' && typeof m.progress === 'number') {
              setProgress(m.progress);
            }
          }
        });
        (async () => {
          try {
            await worker.load();
            await worker.loadLanguage('eng+deu'); // englisch + deutsch
            await worker.initialize('eng+deu');
            // OCR-Parameter: eher „Block Text“
            await worker.setParameters({
              tessedit_pageseg_mode: '6', // PSM 6: ein Block mit Text
              preserve_interword_spaces: '1',
              user_defined_dpi: '300'
            });
            resolve(worker);
          } catch (e) {
            reject(e);
          }
        })();
      } else {
        // Fallback: Bibliothek nachladen
        const s = document.createElement('script');
        s.src = 'https://cdn.jsdelivr.net/npm/tesseract.js@5/dist/tesseract.min.js';
        s.async = true;
        s.onload = () => {
          if (!Tesseract?.createWorker) return reject(new Error('Tesseract lädt, aber createWorker fehlt'));
          resolve(ensureWorker());
        };
        s.onerror = () => reject(new Error('Tesseract konnte nicht geladen werden'));
        document.head.appendChild(s);
      }
    });
    return workerPromise;
   }
   }


   // ========= BILD-VORVERARBEITUNG =========
   // --------- Index ----------
   function toCanvasFromImage (img, maxSide) {
  let INDEX=[], INDEX_EMB=[];
     const MAX = maxSide || 1800;
   async function loadIndex({ ui=true }={}){
     const scale = Math.min(1, (img.width > img.height) ? (MAX / img.width) : (MAX / img.height));
     if(INDEX.length) return INDEX;
     const w = Math.max(1, Math.round(img.width  * scale));
     if(ui){ setStatus('Index laden …'); setProgress(0.03); }
     const h = Math.max(1, Math.round(img.height * scale));
     const rawURL = mw.util.getUrl(CFG.indexTitle,{ action:'raw', ctype:'application/json' });
     const c = document.createElement('canvas');
     const res = await fetch(rawURL,{ cache:'reload' });
     c.width = w; c.height = h;
    if(!res.ok) throw new Error('Index nicht ladbar: '+res.status);
     const ctx = c.getContext('2d', { willReadFrequently: true });
     const json = await res.json();
     ctx.imageSmoothingEnabled = true;
    if(!Array.isArray(json)) throw new Error('Index ist keine Array-JSON');
     ctx.drawImage(img, 0, 0, w, h);
     INDEX = json;
     return c;
     INDEX_EMB = INDEX.map(it => (typeof it.embed==='string' && it.embed.length) ? base64ToFloat32(it.embed) : null);
     log('Index geladen:', INDEX.length, 'Einträge');
     log('Embeddings vorhanden:', INDEX_EMB.filter(v=>v&&v.length).length, '/', INDEX.length);
    if(ui) setProgress(0.06);
     return INDEX;
   }
   }


   function grayscaleContrastUnsharp (canvas) {
   // --------- Transformers (lokal) ----------
    const ctx = canvas.getContext('2d', { willReadFrequently: true });
  let _visionLoadPromise=null;
    const { width: w, height: h } = canvas;
  async function ensureClipVision(){
     const id = ctx.getImageData(0, 0, w, h);
     if(_visionLoadPromise) return _visionLoadPromise;
    const d = id.data;


     // 1) Graustufen + Kontrast
     setStatus('Modell laden …'); setProgress(0.08);
    let min=255, max=0;
    const gray = new Uint8ClampedArray(w*h);
    for (let i=0, j=0; i<d.length; i+=4, j++) {
      const g = 0.2126*d[i] + 0.7152*d[i+1] + 0.0722*d[i+2];
      gray[j] = g;
      if (g<min) min=g; if (g>max) max=g;
    }
    const span = Math.max(1, max-min);
    for (let j=0; j<gray.length; j++) {
      let v = (gray[j]-min)/span;          // 0..1
      v = Math.pow(v, 0.9);                 // leichte Gamma-Korrektur
      gray[j] = Math.max(0, Math.min(255, Math.round(v*255)));
    }


     // 2) Leichtes Unsharp Mask
     _visionLoadPromise = (async()=>{
    // einfacher 3x3-Box-Blur und dann Original + Amount*(Original-Blur)
       const mod = await import(/* webpackIgnore: true */ CFG.transformersURL);
    const blur = new Uint8ClampedArray(gray.length);
    const off = [-w-1,-w,-w+1, -1,0,1, w-1,w,w+1];
    for (let y=1;y<h-1;y++){
       for (let x=1;x<w-1;x++){
        let s=0;
        const idx=y*w+x;
        for (let k=0;k<9;k++) s += gray[idx+off[k]];
        blur[idx] = s/9;
      }
    }
    const amount=0.65;
    for (let i=0;i<gray.length;i++){
      let v = gray[i] + amount*(gray[i] - (blur[i]||gray[i]));
      gray[i] = v<0?0:v>255?255:v;
    }


    // 3) Adaptive Schwelle light (global + lokale Korrektur)
      // Nur lokal laden
    // global threshold um den Mittelwert, dann leichte Aufhellung dunkler Zeichen
      mod.env.allowLocalModels = true;
    let sum=0; for (let i=0;i<gray.length;i++) sum+=gray[i];
      mod.env.allowRemoteModels = false;
    const mean = sum/gray.length;
       mod.env.localModelPath  = CFG.localModelPath;
    for (let i=0, p=0; i<d.length; i+=4, p++) {
       const v = gray[p] < mean*0.97 ? 0 : 255; // binär
      d[i]=d[i+1]=d[i+2]=v; d[i+3]=255;
    }
    ctx.putImageData(id, 0, 0);
    return canvas;
  }


  function rotateCanvas (src, deg) {
      // WASM-Runtime (ort-wasm-simd.wasm) von transformers-CDN
    const rad = deg * Math.PI/180;
      mod.env.backends = mod.env.backends || {};
    const w = src.width, h = src.height;
      mod.env.backends.onnx = mod.env.backends.onnx || {};
    const swap = (deg % 180) !== 0;
      mod.env.backends.onnx.wasm = mod.env.backends.onnx.wasm || {};
    const c = document.createElement('canvas');
      mod.env.backends.onnx.wasm.wasmPaths =
    c.width = swap ? h : w;
        'https://cdn.jsdelivr.net/npm/@xenova/transformers@2.15.0/dist/';
    c.height = swap ? w : h;
    const ctx = c.getContext('2d');
    ctx.translate(c.width/2, c.height/2);
    ctx.rotate(rad);
    ctx.drawImage(src, -w/2, -h/2);
    return c;
  }


  function cropCanvas (src, x, y, w, h) {
      const [processor, model] = await Promise.all([
    const c = document.createElement('canvas');
        mod.AutoProcessor.from_pretrained(CFG.modelId),
    c.width = w; c.height = h;
        mod.CLIPVisionModelWithProjection.from_pretrained(CFG.modelId, { quantized: true })
    c.getContext('2d').drawImage(src, x, y, w, h, 0, 0, w, h);
      ]);
    return c;
  }


  function buildCandidates (base) {
      let backend='unknown';
    // Vollbild + zentrale & untere Bänder, je Rotation 0/+90/-90
      try { backend = model?.session?.executionProvider || backend; } catch(_){}
    const L = [];
       log('CLIP ready (vision, local):', model?.constructor?.name || 'unknown', '| Backend:', backend);
    const rotations = [0, 90, -90];
    rotations.forEach((deg) => {
       const r = deg ? rotateCanvas(base, deg) : base;
      const w = r.width, h = r.height;
      const full = grayscaleContrastUnsharp(r.cloneNode ? r.cloneNode(true) : r);
      L.push(full);


       // zentral ~70% Bereich
       return { mod, processor, model };
      const cw = Math.round(w*0.8), ch = Math.round(h*0.7);
    })();
      const cx = Math.round((w-cw)/2), cy = Math.round((h-ch)/2);
      L.push(grayscaleContrastUnsharp(cropCanvas(r, cx, cy, cw, ch)));


      // unteres Band (viele ADOS haben unten Textblöcke)
     return _visionLoadPromise;
      const bh = Math.round(h*0.38);
      L.push(grayscaleContrastUnsharp(cropCanvas(r, 0, h-bh, w, bh)));
    });
     return L;
   }
   }


   // ========= OCR PIPELINE =========
   // --------- Auto-Crop Heuristik ----------
  async function runOCR (file) {
  function toCanvasScaled(img, maxSide){
     const worker = await ensureWorker();
    const c=document.createElement('canvas');
     setProgress(0);
    let { width:w, height:h } = img;
    const s = Math.min(1, maxSide / Math.max(w,h));
    w = Math.round(w*s); h = Math.round(h*s);
    c.width=w; c.height=h;
    const g=c.getContext('2d', { willReadFrequently:true });
     g.imageSmoothingEnabled = true;
     g.drawImage(img,0,0,w,h);
    return c;
  }


    // Bild laden → Canvas → Kandidaten erzeugen
  function autoCropCanvas(inCanvas){
    const img = await new Promise((res, rej) => {
    const w=inCanvas.width, h=inCanvas.height;
      const o = new Image();
    const ctx=inCanvas.getContext('2d', { willReadFrequently:true });
      o.onload = () => res(o);
     const imgData=ctx.getImageData(0,0,w,h);
      o.onerror = () => rej(new Error('Bild konnte nicht geladen werden'));
     const data=imgData.data;
      o.src = URL.createObjectURL(file);
    });
     const base = toCanvasFromImage(img, 1800);
     const candidates = buildCandidates(base);


     let best = { text: '', conf: 0 };
     // Graustufen
    // Zwei PSM-Modi probieren (6 → Block, 7 → eine Textzeile – robust gegen plakative Schriften)
    const gray=new Uint8ClampedArray(w*h);
    const PSMs = ['6','7'];
    for(let y=0, p=0, i=0; y<h; y++){
      for(let x=0; x<w; x++, i++, p+=4){
        const r=data[p], g=data[p+1], b=data[p+2];
        gray[i] = (0.299*r + 0.587*g + 0.114*b)|0;
      }
    }


     for (const c of candidates) {
     // Sobel-Kanten (Magnitude)
      for (const psm of PSMs) {
    const mag=new Float32Array(w*h);
        try {
    const sobelX=[-1,0,1,-2,0,2,-1,0,1];
          await worker.setParameters({ tessedit_pageseg_mode: psm });
    const sobelY=[-1,-2,-1,0,0,0,1,2,1];
          const { data } = await worker.recognize(c);
    for(let y=1; y<h-1; y++){
          const text = data?.text ? String(data.text) : '';
      for(let x=1; x<w-1; x++){
          const conf = (data?.confidence || 0);
        let gx=0, gy=0, k=0;
          // Heuristik: genug Buchstaben?
        for(let j=-1;j<=1;j++){
           const letters = (text.match(/[A-Za-zÄÖÜäöüß]{2,}/g) || []).length;
           for(let i=-1;i<=1;i++,k++){
          const score = conf + letters*1.5;
            const v=gray[(y+j)*w + (x+i)];
          if (score > (best.conf + (best.letters||0)*1.5)) {
             gx += sobelX[k]*v; gy += sobelY[k]*v;
             best = { text, conf, letters };
           }
           }
          // Wenn sehr gut: früh abbrechen
          if (conf > 75 && letters > 15) break;
        } catch (e) {
          // einfach nächsten Kandidaten probieren
         }
         }
        mag[y*w+x] = Math.hypot(gx,gy);
       }
       }
     }
     }


     setProgress(null);
     // Schwellwert: oberes x%-Quantil
    const vals = Array.from(mag).sort((a,b)=>a-b);
    const keep = CFG.edgeKeepRatio;
    const tIdx = Math.max(0, Math.min(vals.length-1, Math.floor(vals.length*(1-keep))));
    const thr = vals[tIdx];
 
    // Bounding-Box der Pixel > thr
    let minX=w, minY=h, maxX=0, maxY=0, count=0;
    for(let y=0;y<h;y++){
      for(let x=0;x<w;x++){
        const m=mag[y*w+x];
        if(m>thr){ count++; if(x<minX)minX=x; if(y<minY)minY=y; if(x>maxX)maxX=x; if(y>maxY)maxY=y; }
      }
    }
 
    if(count<50) return inCanvas; // zu wenig Signal → return original
 
    // Padding
    const pad = Math.round(CFG.cropPadding * Math.max(w,h));
    minX = Math.max(0, minX - pad);
    minY = Math.max(0, minY - pad);
    maxX = Math.min(w-1, maxX + pad);
    maxY = Math.min(h-1, maxY + pad);


     // Debug-Ausgabe
     // Mindestgröße
     const dbgEl = document.getElementById('ados-scan-ocr');
    const boxW=maxX-minX+1, boxH=maxY-minY+1;
     if (dbgEl) dbgEl.textContent = best.text || '(kein Text erkannt)';
     const minLen = Math.round(CFG.cropMinRel * Math.min(w,h));
    let cx=minX, cy=minY, cw=boxW, ch=boxH;
     if(cw<minLen || ch<minLen){
      const needW = Math.max(minLen, cw);
      const needH = Math.max(minLen, ch);
      const centerX = Math.round((minX+maxX)/2);
      const centerY = Math.round((minY+maxY)/2);
      cx = Math.max(0, Math.min(w-needW, centerX - Math.floor(needW/2)));
      cy = Math.max(0, Math.min(h-needH, centerY - Math.floor(needH/2)));
      cw = needW; ch = needH;
    }


     return best.text || '';
     const out=document.createElement('canvas');
    out.width=cw; out.height=ch;
    out.getContext('2d').drawImage(inCanvas, cx, cy, cw, ch, 0, 0, cw, ch);
    return out;
   }
   }


   // ========= HINWEISE EXTRAHIEREN & SUCHE =========
   // --------- Embedding-Pipeline ---------
   function extractHints (text) {
   async function embedFileImage(file){
     const raw = String(text || '').replace(/\s+/g, ' ').trim();
     const { mod, processor, model } = await ensureClipVision();


     const names = [];
     setStatus('Bild vorbereiten …'); setProgress(0.20);
     KNOWN_TOKENS.forEach(t => {
 
       const re = new RegExp('\\b' + t.replace(/[.*+?^${}()|[\]\\]/g, '\\$&') + '\\b', 'i');
    // 1) Bild laden
       if (re.test(raw)) names.push(t);
     const img = await new Promise((res,rej)=>{
       const url=URL.createObjectURL(file);
      const image=new Image();
      image.crossOrigin='anonymous';
      image.onload=()=>{ URL.revokeObjectURL(url); res(image); };
       image.onerror=e=>{ URL.revokeObjectURL(url); rej(e); };
      image.src=url;
     });
     });


     const ages = [];
     // 2) Scale → Auto-Crop
     let m; const ageRe = /\b([1-9]\d?)\s?(?:years?|yo|jahr(?:e)?)\b/gi;
     let canvas = toCanvasScaled(img, CFG.maxSide);
     while ((m = ageRe.exec(raw)) !== null) { const n = m[1]; if (!ages.includes(n)) ages.push(n); }
     if(CFG.autoCrop){
      setStatus('Auto-Crop …'); setProgress(0.30);
      canvas = autoCropCanvas(canvas);
    }


     const years = [];
     // 3) Canvas → Blob → RawImage (robust für Processor)
    const yearRe = /\b(19|20)\d{2}\b/g;
     const blob = await new Promise(r => canvas.toBlob(r, 'image/jpeg', 0.95));
     while ((m = yearRe.exec(raw)) !== null) { const y = m[0]; if (!years.includes(y)) years.push(y); }
    const imageRaw = await mod.RawImage.fromBlob(blob);


     const words = [];
     setStatus('Bild analysieren …'); setProgress(0.45);
    const seen = new Set();
    const wordRe = /\b[A-ZÄÖÜ][A-Za-zÄÖÜäöüß\-]{3,}\b/g;
    while ((m = wordRe.exec(raw)) !== null) { const w = m[0]; if (!seen.has(w)) { seen.add(w); words.push(w); if (words.length>=8) break; } }


     return { names, ages, years, words, raw };
     // 4) Processor & Model
  }
    const inputs = await processor(imageRaw, { return_tensors: 'pt' });
    const out = await model.forward({ pixel_values: inputs.pixel_values });


  async function searchWikiSmart (hints, limit) {
     const vec = out?.image_embeds?.data || out?.image_embeds;
     await mw.loader.using('mediawiki.api');
     if(!(vec instanceof Float32Array)) throw new Error('Embedding-Format unerwartet');
     const api = new mw.Api();
    const ns0 = 0, MAX = limit || 12;


     const incats = ADOS_CATEGORIES.length
    // 5) Normieren
      ? ADOS_CATEGORIES.map(c => 'incategory:"' + c + '"').join(' ')
    let n=0; for(let i=0;i<vec.length;i++) n+=vec[i]*vec[i];
      : '';
    const norm = Math.sqrt(n)||1;
     const v = new Float32Array(vec.length);
    for(let i=0;i<vec.length;i++) v[i]=vec[i]/norm;
    return v;
  }


    const buckets = [];
  function cosine(a,b){ let s=0,L=Math.min(a.length,b.length); for(let i=0;i<L;i++) s+=a[i]*b[i]; return s; }


    // PASS 1: sehr eng (intitle + Kategorien)
  // vorher: slice(0, topK) hier
    if (hints.names.length) {
  // jetzt: ALLE sortiert zurückgeben, damit wir danach deduplizieren können
      hints.names.forEach(n => {
  function rankByCosine(q){
        if (hints.ages.length) hints.ages.forEach(a => buckets.push(`intitle:"${n}" intitle:${a} ${incats}`.trim()));
    const s=[];
        if (hints.years.length) hints.years.forEach(y => buckets.push(`intitle:"${n}" "${y}" ${incats}`.trim()));
    for(let i=0;i<INDEX.length;i++){
        buckets.push(`intitle:"${n}" ${incats}`.trim());
      const v=INDEX_EMB[i];
      });
      if(!v) continue;
      s.push({ i, score: cosine(q,v) });
     }
     }
     // PASS 2: keyword-bündel
     s.sort((a,b)=> b.score-a.score);
    const key = [].concat(hints.names.slice(0,2), hints.ages.slice(0,1), hints.years.slice(0,1), hints.words.slice(0,3))
     return s;
                  .map(x => `"${x}"`).join(' ');
  }
     if (key) buckets.push(`${key} ${incats}`.trim());


    // PASS 3: ohne Kategorien (breiter Fallback)
  // NEU: pro Titel nur bester Treffer
     if (ADOS_CATEGORIES.length) {
  function dedupeByTitle(ranked){
       if (hints.names.length) hints.names.forEach(n => buckets.push(`intitle:"${n}"`));
     const bestByTitle = Object.create(null);
       if (key) buckets.push(key);
    for (let k = 0; k < ranked.length; k++) {
       const hit = ranked[k];
      const it = INDEX[hit.i];
      const rawTitle = it && it.title ? String(it.title) : '';
      const key = rawTitle.trim().toLowerCase();
      if (!key) continue;
      const prev = bestByTitle[key];
      if (!prev || hit.score > prev.score) {
        bestByTitle[key] = hit;
      }
    }
    const arr = [];
    for (const key in bestByTitle) {
       if (Object.prototype.hasOwnProperty.call(bestByTitle, key)) {
        arr.push(bestByTitle[key]);
      }
     }
     }
    arr.sort(function(a,b){ return b.score - a.score; });
    return arr;
  }


    // PASS 4: Prefix
  // --------- Score-Badges ---------
    if (hints.names.length) buckets.push(hints.names[0]);
  function scoreBadge(score){
     else if (hints.words.length) buckets.push(hints.words[0]);
     if (CFG.showNumericScore) {
 
    return `<span style="font-variant-numeric:tabular-nums;color:#666">${score.toFixed(3)}</span>`;
    const seen = new Set(); const out = [];
    async function runSearch (q) {
      if (!q) return;
      const r = await api.get({ action:'query', list:'search', srsearch:q, srnamespace: ns0, srlimit: MAX, formatversion:2 });
      (r.query?.search || []).forEach(it => { if (!seen.has(it.title)) { seen.add(it.title); out.push(it); } });
    }
    for (const q of buckets) {
      await runSearch(q);
      if (out.length >= MAX) break;
    }
    if (out.length < MAX) {
      // Prefix-Fallback
      const p = hints.names[0] || hints.words[0] || '';
      if (p) {
        const r = await api.get({ action:'query', list:'prefixsearch', pssearch:p, psnamespace: ns0, pslimit: MAX });
        (r.query?.prefixsearch || []).forEach(it => {
          const title = it.title || it['*'];
          if (!seen.has(title)) { seen.add(title); out.push({ title, snippet:'' }); }
        });
      }
     }
     }
     return out.slice(0, MAX);
     const [hi, mid] = CFG.confidenceBands || [0.90, 0.80];
    let txt = 'niedrig', bg = '#f1f5f9', fg = '#334155';
    if (score >= hi) { txt = 'hoch';  bg = '#e6ffed'; fg = '#0a7d2c'; }
    else if (score >= mid) { txt = 'mittel'; bg = '#fff7e6'; fg = '#a45500'; }
    return `<span style="display:inline-block;padding:.12rem .45rem;border-radius:999px;background:${bg};color:${fg};font-weight:600;font-size:.85em;line-height:1">${txt}</span>`;
   }
   }


   function esc (s) { return mw.html.escape(String(s||'')); }
   // --------- Rendering (max. 3 Treffer) ---------
   function renderResults (items) {
// Score-Badge ausgeblendet
     const box = document.getElementById('ados-scan-results');
// <div>${scoreBadge(score)}</div>
     if (!box) return;
 
     box.innerHTML = '';
   function renderResults(ranked){
     if (!items || !items.length) {
     const box=qs('ados-scan-results');
       box.innerHTML = '<div class="ados-hit">Keine klaren Treffer. Bitte anderes Foto oder manuell suchen.</div>';
     if(!box) return;
     box.innerHTML='';
 
     if(!ranked || !ranked.length){
       box.innerHTML='<div class="empty">Keine klaren Treffer. Bitte ein anderes Foto oder näher am Frontlabel.</div>';
       return;
       return;
     }
     }
     items.slice(0, 12).forEach(it => {
 
       const title = it.title || '';
    // NEU: Dedupe nach Titel, DANN auf topK begrenzen
      const link  = mw.util.getUrl(title.replace(/ /g,'_'));
     const uniqueRanked = dedupeByTitle(ranked).slice(0, CFG.topK);
      const snip  = String(it.snippet || '').replace(/<\/?span[^>]*>/g, '').replace(/&quot;/g, '"');
 
       const div = document.createElement('div');
    const makeCard = (it, score) => `
      div.className = 'ados-hit';
       <div class="ados-card" style="display:grid;grid-template-columns:120px 1fr;gap:14px;align-items:center;padding:12px;border:1px solid #e6e6e6;border-radius:14px;box-shadow:0 1px 8px rgba(0,0,0,.04);">
      div.innerHTML =
        ${it.thumb?`<img src="${it.thumb}" alt="" style="width:120px;height:auto;border-radius:10px;">`
        '<b><a href="'+link+'">'+esc(title)+'</a></b>' +
                  :`<div style="width:120px;height:90px;background:#f3f3f3;border-radius:10px;"></div>`}
        (snip ? '<div class="meta">'+snip+'</div>' : '');
        <div style="display:flex;flex-direction:column;gap:8px;">
       box.appendChild(div);
          <div style="font-weight:700;font-size:1.05rem;line-height:1.2;">
            <a href="${mw.util.getUrl((it.title||'').replace(/ /g,'_'))}">${mw.html.escape(it.title||'')}</a>
          </div>
          <div>
            <a href="${mw.util.getUrl((it.title||'').replace(/ /g,'_'))}" class="mw-ui-button" style="display:inline-block;padding:.4rem .7rem;border-radius:8px;background:#2a4b8d;color:#fff;text-decoration:none;">Artikel öffnen</a>
          </div>
        </div>
       </div>`;
 
    const grid = document.createElement('div');
    grid.style.display='grid';
    grid.style.gridTemplateColumns='1fr';
    grid.style.gap='12px';
 
    // max. CFG.topK (=3) Karten nach Dedupe
    uniqueRanked.forEach(function(hit){
      const it = INDEX[hit.i];
       grid.innerHTML += makeCard(it, hit.score);
     });
     });
    box.appendChild(grid);
   }
   }


   // ========= EVENT-BINDING =========
   // --------- UI / Flow ----------
   let BOUND=false;
   let BOUND=false;
   function bind() {
   function bindUI(){
     if (BOUND || !hasUI()) return;
     if(BOUND) return;
     const runBtn = document.getElementById('ados-scan-run');
 
     const bigBtn = document.getElementById('ados-scan-bigbtn');
     const btnRun = qs('ados-scan-run');
     const fileIn = document.getElementById('ados-scan-file');
     const inCam  = qs('ados-scan-file-camera');
     if (!runBtn || !fileIn) return;
     const inGal  = qs('ados-scan-file-gallery');
     BOUND=true;
    const btnCam = qs('ados-scan-btn-camera');
    const btnGal = qs('ados-scan-btn-gallery');
    const drop  = qs('ados-scan-drop');
    const btnReset = qs('ados-scan-reset');
 
     if(!btnRun || !inCam || !inGal) return;
 
    // Hilfsfunktion: wenn neues Bild gewählt → Vorschau & Ergebnisse zurücksetzen
    const onNewImage = (file) => {
      if (!file) return;
      showPreview(file);
      resetResultsBox('Hier erscheinen Treffer.');
      setStatus('Bereit.');
      setProgress(null);
    };
 
    btnCam && btnCam.addEventListener('click', ()=> inCam.click());
    btnGal && btnGal.addEventListener('click', ()=> inGal.click());
 
     const pick = e => {
      const f=e.target.files?.[0];
      if(f) onNewImage(f);
    };
    inCam.addEventListener('change', pick);
    inGal.addEventListener('change', pick);
 
    if(drop){
      drop.addEventListener('dragover', function(ev){ ev.preventDefault(); drop.classList.add('is-over'); });
      drop.addEventListener('dragleave', function(){ drop.classList.remove('is-over'); });
      drop.addEventListener('drop', function(ev){
        ev.preventDefault(); drop.classList.remove('is-over');
        const f = ev.dataTransfer && ev.dataTransfer.files && ev.dataTransfer.files[0];
        if(f){
          const dt=new DataTransfer(); dt.items.add(f);
          inGal.files=dt.files;
          onNewImage(f);
        }
      });
    }


     if (bigBtn) bigBtn.addEventListener('click', () => fileIn.click());
     btnReset && btnReset.addEventListener('click', function(){
    fileIn.addEventListener('change', function(){
      setStatus('Bereit.'); setProgress(null);
       if (this.files && this.files[0]) showPreview(this.files[0]);
      const p=qs('ados-scan-preview'); if(p) p.innerHTML='<div class="note">Noch keine Vorschau.</div>';
       resetResultsBox('Hier erscheinen Treffer.');
      inCam.value=''; inGal.value='';
     });
     });


     runBtn.addEventListener('click', async function (ev) {
     btnRun.addEventListener('click', onRunClick);
      ev.preventDefault();
 
       if (!(fileIn.files && fileIn.files[0])) { alert('Bitte ein Foto auswählen oder aufnehmen.'); return; }
    BOUND=true; log('UI gebunden.');
       try {
  }
        runBtn.disabled = true; runBtn.textContent = 'Erkenne …';
 
        setStatus('Vorverarbeitung & Texterkennung …');
  async function onRunClick(){
        const text = await runOCR(fileIn.files[0]);
    const btnRun = qs('ados-scan-run');
    const inCam  = qs('ados-scan-file-camera');
    const inGal  = qs('ados-scan-file-gallery');
 
    try{
       const file = (inCam.files && inCam.files[0]) || (inGal.files && inGal.files[0]);
      if(!file){ alert('Bitte zuerst ein Foto auswählen.'); return; }
 
       if(btnRun) btnRun.disabled = true;
 
      // Ergebnisse direkt leeren / „Suche läuft …“
      resetResultsBox('Suche läuft …');
 
      await loadIndex({ ui:true });
      await ensureClipVision(); // warmup
 
      const q = await embedFileImage(file);
 
      setProgress(0.70);
      setStatus('Abgleich …');


        setStatus('Suche im Wiki …');
      const ranked = rankByCosine(q);
        const hints = extractHints(text);
      renderResults(ranked);
        const hits  = await searchWikiSmart(hints, 12);


        renderResults(hits);
      setStatus('Fertig.');
        setStatus('Fertig.');
       setProgress(null);
       } catch (e) {
    } catch(e){
        console.error('[LabelScan]', e);
      err('Fehler', e);
        setStatus('Fehler bei Erkennung/Suche. Bitte erneut versuchen.');
      setStatus('Fehler bei Erkennung.');
       } finally {
      resetResultsBox('Fehler bei der Erkennung – bitte ein anderes Foto versuchen.');
        runBtn.disabled = false; runBtn.textContent = '🔍 Erkennen & suchen';
       setProgress(null);
       }
    } finally {
      if(btnRun) btnRun.disabled = false;
    }
  }
 
  function init(){
    if(document.readyState==='loading'){
      document.addEventListener('DOMContentLoaded', bindUI, { once: true });
    } else {
       bindUI();
    }
    loadIndex({ ui:false }).catch(err).finally(()=>{
      setStatus('Bereit.');
      resetResultsBox('Hier erscheinen Treffer.');
      setProgress(null);
     });
     });
   }
   }


   if (document.readyState === 'loading') document.addEventListener('DOMContentLoaded', bind);
   log('gadget file loaded');
  else bind();
   init();
   setTimeout(bind, 250); setTimeout(bind, 1000);
  new MutationObserver(() => { if (!BOUND) bind(); })
    .observe(document.documentElement || document.body, { childList:true, subtree:true });


})();
})();