Zum Inhalt springen

MediaWiki:Gadget-LabelScan.js: Unterschied zwischen den Versionen

Aus ADOS Wiki
Keine Bearbeitungszusammenfassung
Markierung: Zurückgesetzt
Keine Bearbeitungszusammenfassung
 
(35 dazwischenliegende Versionen desselben Benutzers werden nicht angezeigt)
Zeile 1: Zeile 1:
/* global mw */
/* global mw */
(function(){
(() => {
   'use strict';
   'use strict';
  // ---------- Konfiguration ----------
  function log(){ console.log('[LabelScan]', ...arguments); }
  function err(){ console.error('[LabelScan] Fehler', ...arguments); }


   const CFG = {
   const CFG = {
     // ESM-Build (wichtig!):
     // ---- Daten & Model ----
     transformersURL: 'https://cdn.jsdelivr.net/npm/@xenova/transformers@2.15.0/dist/transformers.min.js',
    indexTitle: (window.LabelScanConfig && window.LabelScanConfig.indexTitle) ||
                'MediaWiki:Gadget-LabelScan-index.json',
     transformersURL: 'https://cdn.jsdelivr.net/npm/@xenova/transformers@2.15.0',
     modelId: 'Xenova/clip-vit-base-patch32',
     modelId: 'Xenova/clip-vit-base-patch32',
     topKByPhash: 24,       // wie viele pHash-Kandidaten für CLIP nachladen
     localModelPath: '/models',          // <<— deine Modelle liegen hier
     showN: 8,               // wie viele Treffer anzeigen
 
     indexUrl: mw.util.getUrl('MediaWiki:Gadget-LabelScan-index.json', { action:'raw', ctype:'application/json' })
    topK: 3,                           // <<— MAX. 3 TREFFER
    maxSide: 1280,                      // Downscale vor Auto-Crop (Performance)
 
     // ---- Auto-Crop ----
    autoCrop: true,
    edgeKeepRatio: 0.10,                // oberste 10% Kanten als Maske
    cropPadding: 0.08,                 // 8% Randzugabe um die Box
     cropMinRel: 0.40,                  // min. 40% der kleineren Bildkante
 
    // ---- Score-Badges ----
    showNumericScore: false,            // true = Zahlen zeigen, false = Badges
    confidenceBands: [0.90, 0.80],      // hoch ≥0.90, mittel ≥0.80, sonst niedrig
 
    // ---- Sonstiges ----
    debug: true
   };
   };


   // ---------- UI Helfer ----------
   // --------- Helpers ----------
   function $(id){ return document.getElementById(id); }
   const log=(...a)=>{ if(CFG.debug) console.log('[LabelScan]',...a); };
   function setStatus(t){ const el=$('ados-scan-status'); if(el) el.textContent=t||''; }
  const warn=(...a)=>{ if(CFG.debug) console.warn('[LabelScan]',...a); };
   function setProgress(p){
  const err=(...a)=>{ console.error('[LabelScan]',...a); };
     const bar=$('ados-scan-progress');
  const qs=id=>document.getElementById(id);
    if(!bar) return;
   const setStatus=t=>{ const el=qs('ados-scan-status'); if(el) el.textContent=t||''; };
     if(p==null){ bar.hidden=true; bar.value=0; return; }
   const setProgress=p=>{
     bar.hidden=false; bar.value=Math.max(0,Math.min(1,p));
     const bar=qs('ados-scan-progress'); if(!bar) return;
     if(p==null){ bar.hidden=true; bar.value=0; }
     else{ bar.hidden=false; bar.value=Math.max(0,Math.min(1,p)); }
  };
 
  function resetResultsBox(msg){
    const r = qs('ados-scan-results');
    if (r) {
      r.innerHTML = `<div class="empty">${msg || 'Hier erscheinen Treffer.'}</div>`;
    }
   }
   }
   function showPreview(file){
   function showPreview(file){
     const url=URL.createObjectURL(file);
     const url=URL.createObjectURL(file);
     const prev=$('ados-scan-preview');
     const prev=qs('ados-scan-preview');
     if(prev){
     if(prev){
       prev.innerHTML = '<img alt="Vorschau" style="max-width:100%;height:auto;border-radius:8px;" />';
       prev.innerHTML=`<img alt="Vorschau" style="max-width:260px;width:100%;height:auto;border-radius:8px;display:block;margin:0 auto;" src="${url}">`;
      const img=prev.querySelector('img'); img.src=url;
       prev.setAttribute('aria-hidden','false');
       prev.setAttribute('aria-hidden','false');
     }
     }
   }
   }
   function renderResults(items){
 
     const box=$('ados-scan-results'); if(!box) return;
   function base64ToFloat32(b64){
    box.innerHTML='';
     const bin=atob(b64), len=bin.length;
    if(!items || !items.length){
     const buf=new ArrayBuffer(len), view=new Uint8Array(buf);
      box.innerHTML='<div class="empty">Keine klaren Treffer. Bitte anderes Foto oder manuell suchen.</div>';
    for(let i=0;i<len;i++) view[i]=bin.charCodeAt(i);
      return;
     return new Float32Array(buf);
     }
    items.slice(0, CFG.showN).forEach(it=>{
      const url = mw.util.getUrl(String(it.title||'').replace(/ /g,'_'));
      const div=document.createElement('div');
      div.className='ados-hit';
      div.style.margin='6px 0';
      div.innerHTML =
        '<div style="display:flex;gap:10px;align-items:flex-start;">' +
          (it.thumb? `<img src="${it.thumb}" alt="" style="width:64px;height:auto;border-radius:6px;border:1px solid #eee;">` : '') +
          `<div><div><b><a href="${url}">${mw.html.escape(it.title||'')}</a></b></div>` +
          `<div class="meta" style="color:#666;font-size:90%;">Score: ${(it.score||0).toFixed(3)}</div></div>` +
        '</div>';
      box.appendChild(div);
     });
   }
   }


   // ---------- Index laden ----------
   // --------- Index ----------
   let _indexPromise=null, INDEX=[];
   let INDEX=[], INDEX_EMB=[];
   async function ensureIndex(){
   async function loadIndex({ ui=true }={}){
     if(_indexPromise) return _indexPromise;
     if(INDEX.length) return INDEX;
     _indexPromise = fetch(CFG.indexUrl, { cache:'reload' })
    if(ui){ setStatus('Index laden …'); setProgress(0.03); }
      .then(r=>{ if(!r.ok) throw new Error('Index HTTP '+r.status); return r.json(); })
     const rawURL = mw.util.getUrl(CFG.indexTitle,{ action:'raw', ctype:'application/json' });
      .then(data=>{
    const res = await fetch(rawURL,{ cache:'reload' });
        if(!Array.isArray(data)) throw new Error('Index ist kein Array');
    if(!res.ok) throw new Error('Index nicht ladbar: '+res.status);
        INDEX=data.filter(x=>x && x.title && x.thumb && x.phash);
    const json = await res.json();
        log('Index geladen:', INDEX.length, 'Einträge');
    if(!Array.isArray(json)) throw new Error('Index ist keine Array-JSON');
        return INDEX;
    INDEX = json;
      })
    INDEX_EMB = INDEX.map(it => (typeof it.embed==='string' && it.embed.length) ? base64ToFloat32(it.embed) : null);
      .catch(e=>{ err(e); INDEX=[]; return INDEX; });
    log('Index geladen:', INDEX.length, 'Einträge');
     return _indexPromise;
    log('Embeddings vorhanden:', INDEX_EMB.filter(v=>v&&v.length).length, '/', INDEX.length);
    if(ui) setProgress(0.06);
     return INDEX;
   }
   }


   // ---------- pHash ----------
   // --------- Transformers (lokal) ----------
   // erwartet 16-hex (64bit) oder 32-hex (128bit); wir normalisieren auf 64bit Vergleich
   let _visionLoadPromise=null;
   function hexToBigInt(h){ try{ return BigInt('0x'+String(h).trim()); } catch(_){ return null; } }
   async function ensureClipVision(){
  function hamming64(aHex,bHex){
    if(_visionLoadPromise) return _visionLoadPromise;
    const a=hexToBigInt(aHex), b=hexToBigInt(bHex);
 
    if(a===null || b===null) return 64;
    setStatus('Modell laden …'); setProgress(0.08);
    let x=a^b, d=0n;
 
    while(x){ d += (x & 1n); x >>= 1n; }
    _visionLoadPromise = (async()=>{
     return Number(d);
      const mod = await import(/* webpackIgnore: true */ CFG.transformersURL);
 
      // Nur lokal laden
      mod.env.allowLocalModels = true;
      mod.env.allowRemoteModels = false;
      mod.env.localModelPath  = CFG.localModelPath;
 
      // WASM-Runtime (ort-wasm-simd.wasm) von transformers-CDN
      mod.env.backends = mod.env.backends || {};
      mod.env.backends.onnx = mod.env.backends.onnx || {};
      mod.env.backends.onnx.wasm = mod.env.backends.onnx.wasm || {};
      mod.env.backends.onnx.wasm.wasmPaths =
        'https://cdn.jsdelivr.net/npm/@xenova/transformers@2.15.0/dist/';
 
      const [processor, model] = await Promise.all([
        mod.AutoProcessor.from_pretrained(CFG.modelId),
        mod.CLIPVisionModelWithProjection.from_pretrained(CFG.modelId, { quantized: true })
      ]);
 
      let backend='unknown';
      try { backend = model?.session?.executionProvider || backend; } catch(_){}
      log('CLIP ready (vision, local):', model?.constructor?.name || 'unknown', '| Backend:', backend);
 
      return { mod, processor, model };
    })();
 
     return _visionLoadPromise;
   }
   }
   function phashScore(a,b){ // 1..0
 
     const d=hamming64(a,b);
  // --------- Auto-Crop Heuristik ----------
     const max=64;
   function toCanvasScaled(img, maxSide){
     return 1 - (d/max);
    const c=document.createElement('canvas');
    let { width:w, height:h } = img;
    const s = Math.min(1, maxSide / Math.max(w,h));
    w = Math.round(w*s); h = Math.round(h*s);
    c.width=w; c.height=h;
     const g=c.getContext('2d', { willReadFrequently:true });
     g.imageSmoothingEnabled = true;
     g.drawImage(img,0,0,w,h);
    return c;
   }
   }


   // ---------- Bild laden ----------
   function autoCropCanvas(inCanvas){
  function fileToImage(file){
    const w=inCanvas.width, h=inCanvas.height;
     return new Promise((res,rej)=>{
    const ctx=inCanvas.getContext('2d', { willReadFrequently:true });
       const img=new Image();
    const imgData=ctx.getImageData(0,0,w,h);
       img.onload=()=>res(img);
    const data=imgData.data;
       img.onerror=rej;
 
       img.src=URL.createObjectURL(file);
    // Graustufen
     });
    const gray=new Uint8ClampedArray(w*h);
    for(let y=0, p=0, i=0; y<h; y++){
      for(let x=0; x<w; x++, i++, p+=4){
        const r=data[p], g=data[p+1], b=data[p+2];
        gray[i] = (0.299*r + 0.587*g + 0.114*b)|0;
      }
    }
 
    // Sobel-Kanten (Magnitude)
    const mag=new Float32Array(w*h);
    const sobelX=[-1,0,1,-2,0,2,-1,0,1];
    const sobelY=[-1,-2,-1,0,0,0,1,2,1];
    for(let y=1; y<h-1; y++){
      for(let x=1; x<w-1; x++){
        let gx=0, gy=0, k=0;
        for(let j=-1;j<=1;j++){
          for(let i=-1;i<=1;i++,k++){
            const v=gray[(y+j)*w + (x+i)];
            gx += sobelX[k]*v; gy += sobelY[k]*v;
          }
        }
        mag[y*w+x] = Math.hypot(gx,gy);
      }
    }
 
    // Schwellwert: oberes x%-Quantil
    const vals = Array.from(mag).sort((a,b)=>a-b);
    const keep = CFG.edgeKeepRatio;
    const tIdx = Math.max(0, Math.min(vals.length-1, Math.floor(vals.length*(1-keep))));
    const thr = vals[tIdx];
 
    // Bounding-Box der Pixel > thr
    let minX=w, minY=h, maxX=0, maxY=0, count=0;
    for(let y=0;y<h;y++){
      for(let x=0;x<w;x++){
        const m=mag[y*w+x];
        if(m>thr){ count++; if(x<minX)minX=x; if(y<minY)minY=y; if(x>maxX)maxX=x; if(y>maxY)maxY=y; }
      }
    }
 
    if(count<50) return inCanvas; // zu wenig Signal → return original
 
    // Padding
    const pad = Math.round(CFG.cropPadding * Math.max(w,h));
    minX = Math.max(0, minX - pad);
    minY = Math.max(0, minY - pad);
    maxX = Math.min(w-1, maxX + pad);
    maxY = Math.min(h-1, maxY + pad);
 
    // Mindestgröße
    const boxW=maxX-minX+1, boxH=maxY-minY+1;
     const minLen = Math.round(CFG.cropMinRel * Math.min(w,h));
    let cx=minX, cy=minY, cw=boxW, ch=boxH;
    if(cw<minLen || ch<minLen){
       const needW = Math.max(minLen, cw);
       const needH = Math.max(minLen, ch);
      const centerX = Math.round((minX+maxX)/2);
      const centerY = Math.round((minY+maxY)/2);
       cx = Math.max(0, Math.min(w-needW, centerX - Math.floor(needW/2)));
      cy = Math.max(0, Math.min(h-needH, centerY - Math.floor(needH/2)));
       cw = needW; ch = needH;
    }
 
    const out=document.createElement('canvas');
    out.width=cw; out.height=ch;
    out.getContext('2d').drawImage(inCanvas, cx, cy, cw, ch, 0, 0, cw, ch);
     return out;
   }
   }
   function urlToImage(url){
 
     return new Promise((res,rej)=>{
   // --------- Embedding-Pipeline ---------
       const img=new Image();
  async function embedFileImage(file){
       img.crossOrigin='anonymous';
     const { mod, processor, model } = await ensureClipVision();
       img.onload=()=>res(img);
 
       img.onerror=rej;
    setStatus('Bild vorbereiten …'); setProgress(0.20);
       img.src=url;
 
    // 1) Bild laden
    const img = await new Promise((res,rej)=>{
       const url=URL.createObjectURL(file);
      const image=new Image();
       image.crossOrigin='anonymous';
       image.onload=()=>{ URL.revokeObjectURL(url); res(image); };
       image.onerror=e=>{ URL.revokeObjectURL(url); rej(e); };
       image.src=url;
     });
     });
  }


  // ---------- CLIP laden ----------
    // 2) Scale → Auto-Crop
  let _clipModulePromise=null;
    let canvas = toCanvasScaled(img, CFG.maxSide);
  async function ensureClipExtractor(){
    if(CFG.autoCrop){
    if(_clipModulePromise) return _clipModulePromise;
      setStatus('Auto-Crop …'); setProgress(0.30);
      canvas = autoCropCanvas(canvas);
    }


     setStatus('Modell laden …'); setProgress(0.08);
     // 3) Canvas → Blob → RawImage (robust für Processor)
    const blob = await new Promise(r => canvas.toBlob(r, 'image/jpeg', 0.95));
    const imageRaw = await mod.RawImage.fromBlob(blob);


     _clipModulePromise = (async ()=>{
     setStatus('Bild analysieren …'); setProgress(0.45);
      const mod = await import(/* webpackIgnore: true */ CFG.transformersURL);


      // Nur Remote, im Browser cachen
    // 4) Processor & Model
      mod.env.localModelPath = null;
    const inputs = await processor(imageRaw, { return_tensors: 'pt' });
      mod.env.remoteModels = true;
    const out = await model.forward({ pixel_values: inputs.pixel_values });
      mod.env.allowRemoteModels = true;
      mod.env.useBrowserCache = true;


      const pipe = await mod.pipeline('image-feature-extraction', CFG.modelId, { quantized:true });
    const vec = out?.image_embeds?.data || out?.image_embeds;
      log('CLIP ready:', pipe.model?.constructor?.name || 'unknown');
     if(!(vec instanceof Float32Array)) throw new Error('Embedding-Format unerwartet');
      return { mod, pipe };
     })().catch(e=>{ err(e); throw e; });


     return _clipModulePromise;
    // 5) Normieren
    let n=0; for(let i=0;i<vec.length;i++) n+=vec[i]*vec[i];
    const norm = Math.sqrt(n)||1;
    const v = new Float32Array(vec.length);
    for(let i=0;i<vec.length;i++) v[i]=vec[i]/norm;
     return v;
   }
   }


  // ---------- Embeddings & Cosine ----------
   function cosine(a,b){ let s=0,L=Math.min(a.length,b.length); for(let i=0;i<L;i++) s+=a[i]*b[i]; return s; }
   function cosine(a,b){
 
    let dot=0, na=0, nb=0;
  // vorher: slice(0, topK) hier
    for(let i=0;i<a.length;i++){ const x=a[i], y=b[i]; dot+=x*y; na+=x*x; nb+=y*y; }
  // jetzt: ALLE sortiert zurückgeben, damit wir danach deduplizieren können
    if(na===0 || nb===0) return 0;
  function rankByCosine(q){
    return dot / (Math.sqrt(na)*Math.sqrt(nb));
    const s=[];
    for(let i=0;i<INDEX.length;i++){
      const v=INDEX_EMB[i];
      if(!v) continue;
      s.push({ i, score: cosine(q,v) });
    }
    s.sort((a,b)=> b.score-a.score);
    return s;
   }
   }
   async function embedImage(img){
 
     const { pipe } = await ensureClipExtractor();
  // NEU: pro Titel nur bester Treffer
     // transformers akzeptiert HTMLImageElement direkt:
   function dedupeByTitle(ranked){
     const out = await pipe(img);
     const bestByTitle = Object.create(null);
     // out ist typischerweise Float32Array
    for (let k = 0; k < ranked.length; k++) {
     return Array.from(out.data || out);
      const hit = ranked[k];
      const it = INDEX[hit.i];
      const rawTitle = it && it.title ? String(it.title) : '';
      const key = rawTitle.trim().toLowerCase();
      if (!key) continue;
      const prev = bestByTitle[key];
      if (!prev || hit.score > prev.score) {
        bestByTitle[key] = hit;
      }
     }
     const arr = [];
    for (const key in bestByTitle) {
      if (Object.prototype.hasOwnProperty.call(bestByTitle, key)) {
        arr.push(bestByTitle[key]);
      }
     }
     arr.sort(function(a,b){ return b.score - a.score; });
    return arr;
   }
   }
   async function embedURL(url){
 
     const img = await urlToImage(url);
   // --------- Score-Badges ---------
    return embedImage(img);
  function scoreBadge(score){
  }
     if (CFG.showNumericScore) {
  async function embedFile(file){
    return `<span style="font-variant-numeric:tabular-nums;color:#666">${score.toFixed(3)}</span>`;
     const img = await fileToImage(file);
    }
     return embedImage(img);
    const [hi, mid] = CFG.confidenceBands || [0.90, 0.80];
    let txt = 'niedrig', bg = '#f1f5f9', fg = '#334155';
    if (score >= hi) { txt = 'hoch';  bg = '#e6ffed'; fg = '#0a7d2c'; }
     else if (score >= mid) { txt = 'mittel'; bg = '#fff7e6'; fg = '#a45500'; }
     return `<span style="display:inline-block;padding:.12rem .45rem;border-radius:999px;background:${bg};color:${fg};font-weight:600;font-size:.85em;line-height:1">${txt}</span>`;
   }
   }


   // ---------- Matching Pipeline ----------
   // --------- Rendering (max. 3 Treffer) ---------
  async function matchImage(file){
// Score-Badge ausgeblendet
    await ensureIndex();
// <div>${scoreBadge(score)}</div>
    if(!INDEX.length) throw new Error('Index leer.');


     // Vorschau
  function renderResults(ranked){
     showPreview(file);
     const box=qs('ados-scan-results');
     if(!box) return;
    box.innerHTML='';


     // pHash-Kandidaten
     if(!ranked || !ranked.length){
    setStatus('Vorab-Abgleich (pHash) …'); setProgress(0.18);
      box.innerHTML='<div class="empty">Keine klaren Treffer. Bitte ein anderes Foto oder näher am Frontlabel.</div>';
    const userPhash = null; // (Optional: clientseitig pHash berechnen – hier nicht nötig)
      return;
    // Wenn wir keinen pHash des Uploads haben, nehmen wir alle & sortieren später nach CLIP.
     }
    // Für schnellen Vorfilter sortieren wir grob nach Titel-Länge (kein harter Nutzen) → oder zufällig mischen
    // Besser: Wir lassen pHash-Score=0.5 fallback, oder ignorieren pHash.
    // Hier: pHash nicht vorhanden → wir nutzen alle Kandidaten, schneiden aber hart auf topKByPhash zu.
     let prelim = INDEX.map(x=>({ item:x, pScore:0.5 }));


     // Optional: Falls du clientseitig pHash ergänzt, hier pScore via phashScore(user, x.phash) setzen.
     // NEU: Dedupe nach Titel, DANN auf topK begrenzen
    const uniqueRanked = dedupeByTitle(ranked).slice(0, CFG.topK);


     // leichte Bevorzugung kurzer Thumbnails (heuristisch nicht nötig) – wir gehen direkt weiter
     const makeCard = (it, score) => `
    prelim = prelim.slice(0, Math.max(CFG.topKByPhash, 12));
      <div class="ados-card" style="display:grid;grid-template-columns:120px 1fr;gap:14px;align-items:center;padding:12px;border:1px solid #e6e6e6;border-radius:14px;box-shadow:0 1px 8px rgba(0,0,0,.04);">
        ${it.thumb?`<img src="${it.thumb}" alt="" style="width:120px;height:auto;border-radius:10px;">`
                  :`<div style="width:120px;height:90px;background:#f3f3f3;border-radius:10px;"></div>`}
        <div style="display:flex;flex-direction:column;gap:8px;">
          <div style="font-weight:700;font-size:1.05rem;line-height:1.2;">
            <a href="${mw.util.getUrl((it.title||'').replace(/ /g,'_'))}">${mw.html.escape(it.title||'')}</a>
          </div>
          <div>
            <a href="${mw.util.getUrl((it.title||'').replace(/ /g,'_'))}" class="mw-ui-button" style="display:inline-block;padding:.4rem .7rem;border-radius:8px;background:#2a4b8d;color:#fff;text-decoration:none;">Artikel öffnen</a>
          </div>
        </div>
      </div>`;


     // CLIP des Uploads
     const grid = document.createElement('div');
     setStatus('Bild verstehen (KI) …'); setProgress(0.38);
     grid.style.display='grid';
     const userVec = await embedFile(file);
    grid.style.gridTemplateColumns='1fr';
     grid.style.gap='12px';


     // CLIP für Kandidaten
     // max. CFG.topK (=3) Karten nach Dedupe
    setStatus('Kandidaten bewerten …'); setProgress(0.55);
     uniqueRanked.forEach(function(hit){
     let done=0;
       const it = INDEX[hit.i];
    const scored = [];
      grid.innerHTML += makeCard(it, hit.score);
    for(const k of prelim){
    });
       try{
        const v = await embedURL(k.item.thumb);
        const c = cosine(userVec, v);      // 0..1
        const s = 0.6*c + 0.4*k.pScore;    // Kombi aus CLIP (60%) und pHash (40%)
        scored.push({ title:k.item.title, thumb:k.item.thumb, score:s });
      }catch(e){
        // Bild konnte nicht geladen werden → überspringen
      }finally{
        done++; setProgress(0.55 + 0.35*(done/prelim.length));
      }
    }


     scored.sort((a,b)=>b.score-a.score);
     box.appendChild(grid);
    return scored;
   }
   }


   // ---------- Bindings ----------
   // --------- UI / Flow ----------
  let BOUND=false;
   function bindUI(){
   function bindUI(){
     const btnCam  = $('ados-scan-btn-camera');
     if(BOUND) return;
    const btnGal  = $('ados-scan-btn-gallery');
    const inCam    = $('ados-scan-file-camera');
    const inGal    = $('ados-scan-file-gallery');
    const btnRun  = $('ados-scan-run');
    const btnReset = $('ados-scan-reset');
    const drop    = $('ados-scan-drop');


     if(!btnRun || !btnReset || !btnCam || !btnGal || !inCam || !inGal){
    const btnRun = qs('ados-scan-run');
       log('UI unvollständig – Seite lädt evtl. ohne HTML-Wrapper <html>…</html>?');
    const inCam  = qs('ados-scan-file-camera');
       return;
    const inGal  = qs('ados-scan-file-gallery');
     }
    const btnCam = qs('ados-scan-btn-camera');
    const btnGal = qs('ados-scan-btn-gallery');
    const drop  = qs('ados-scan-drop');
    const btnReset = qs('ados-scan-reset');
 
     if(!btnRun || !inCam || !inGal) return;
 
    // Hilfsfunktion: wenn neues Bild gewählt → Vorschau & Ergebnisse zurücksetzen
    const onNewImage = (file) => {
       if (!file) return;
      showPreview(file);
      resetResultsBox('Hier erscheinen Treffer.');
      setStatus('Bereit.');
       setProgress(null);
     };


     // Buttons → Inputs
     btnCam && btnCam.addEventListener('click', ()=> inCam.click());
    btnCam.addEventListener('click', ()=> inCam.click());
     btnGal && btnGal.addEventListener('click', ()=> inGal.click());
     btnGal.addEventListener('click', ()=> inGal.click());


     function onPick(ev){
     const pick = e => {
       const f = ev.target.files && ev.target.files[0];
       const f=e.target.files?.[0];
       if(f){ showPreview(f); setStatus('Bereit zum Erkennen.'); }
       if(f) onNewImage(f);
     }
     };
     inCam.addEventListener('change', onPick);
     inCam.addEventListener('change', pick);
     inGal.addEventListener('change', onPick);
     inGal.addEventListener('change', pick);


    // Drag&Drop
     if(drop){
     if(drop){
       drop.addEventListener('dragover', e=>{ e.preventDefault(); drop.classList.add('is-over'); });
       drop.addEventListener('dragover', function(ev){ ev.preventDefault(); drop.classList.add('is-over'); });
       drop.addEventListener('dragleave', ()=> drop.classList.remove('is-over'));
       drop.addEventListener('dragleave', function(){ drop.classList.remove('is-over'); });
       drop.addEventListener('drop', e=>{
       drop.addEventListener('drop', function(ev){
         e.preventDefault(); drop.classList.remove('is-over');
         ev.preventDefault(); drop.classList.remove('is-over');
         if(e.dataTransfer && e.dataTransfer.files && e.dataTransfer.files[0]){
         const f = ev.dataTransfer && ev.dataTransfer.files && ev.dataTransfer.files[0];
          const f=e.dataTransfer.files[0];
        if(f){
          // in Galerie-Input setzen (nur zur Verwaltung), Vorschau zeigen
           const dt=new DataTransfer(); dt.items.add(f);
           const dt = new DataTransfer(); dt.items.add(f);
           inGal.files=dt.files;
           inGal.files = dt.files;
           onNewImage(f);
           showPreview(f);
          setStatus('Bereit zum Erkennen.');
         }
         }
       });
       });
     }
     }


     // Reset
     btnReset && btnReset.addEventListener('click', function(){
    btnReset.addEventListener('click', ()=>{
      setStatus('Bereit.'); setProgress(null);
      const p=qs('ados-scan-preview'); if(p) p.innerHTML='<div class="note">Noch keine Vorschau.</div>';
      resetResultsBox('Hier erscheinen Treffer.');
       inCam.value=''; inGal.value='';
       inCam.value=''; inGal.value='';
      const p=$('ados-scan-preview'); if(p) p.innerHTML='<div class="note">Noch keine Vorschau. Wähle ein Foto.</div>';
      const r=$('ados-scan-results'); if(r) r.innerHTML='<div class="empty">Hier erscheinen passende Abfüllungen mit Link ins Wiki.</div>';
      setStatus('Bereit.'); setProgress(null);
     });
     });


    // Run
     btnRun.addEventListener('click', onRunClick);
     btnRun.addEventListener('click', async ()=>{
      try{
        const file = inCam.files?.[0] || inGal.files?.[0];
        if(!file){ alert('Bitte zuerst ein Foto aufnehmen oder auswählen.'); return; }
        btnRun.disabled=true; setStatus('Starte …'); setProgress(0.05);


        const hits = await matchImage(file);
    BOUND=true; log('UI gebunden.');
        renderResults(hits);
  }
        setStatus('Fertig.');
 
        setProgress(null);
  async function onRunClick(){
       }catch(e){
    const btnRun = qs('ados-scan-run');
        err(e);
    const inCam  = qs('ados-scan-file-camera');
        setStatus('Fehler bei der Erkennung/Suche.');
    const inGal  = qs('ados-scan-file-gallery');
        setProgress(null);
 
       }finally{
    try{
        btnRun.disabled=false;
      const file = (inCam.files && inCam.files[0]) || (inGal.files && inGal.files[0]);
       }
       if(!file){ alert('Bitte zuerst ein Foto auswählen.'); return; }
    });
 
      if(btnRun) btnRun.disabled = true;
 
      // Ergebnisse direkt leeren / „Suche läuft …“
      resetResultsBox('Suche läuft …');
 
      await loadIndex({ ui:true });
      await ensureClipVision(); // warmup
 
      const q = await embedFileImage(file);
 
      setProgress(0.70);
       setStatus('Abgleich …');
 
      const ranked = rankByCosine(q);
       renderResults(ranked);


     log('UI gebunden.');
      setStatus('Fertig.');
      setProgress(null);
     } catch(e){
      err('Fehler', e);
      setStatus('Fehler bei Erkennung.');
      resetResultsBox('Fehler bei der Erkennung – bitte ein anderes Foto versuchen.');
      setProgress(null);
    } finally {
      if(btnRun) btnRun.disabled = false;
    }
   }
   }


  // ---------- Init ----------
   function init(){
   function init(){
    log('gadget file loaded');
    ensureIndex(); // schon mal laden
     if(document.readyState==='loading'){
     if(document.readyState==='loading'){
       document.addEventListener('DOMContentLoaded', bindUI);
       document.addEventListener('DOMContentLoaded', bindUI, { once: true });
     }else{
     } else {
       bindUI();
       bindUI();
     }
     }
    loadIndex({ ui:false }).catch(err).finally(()=>{
      setStatus('Bereit.');
      resetResultsBox('Hier erscheinen Treffer.');
      setProgress(null);
    });
   }
   }


  log('gadget file loaded');
   init();
   init();
})();
})();

Aktuelle Version vom 1. Dezember 2025, 00:03 Uhr

/* global mw */
(() => {
  'use strict';

  const CFG = {
    // ---- Daten & Model ----
    indexTitle: (window.LabelScanConfig && window.LabelScanConfig.indexTitle) ||
                'MediaWiki:Gadget-LabelScan-index.json',
    transformersURL: 'https://cdn.jsdelivr.net/npm/@xenova/transformers@2.15.0',
    modelId: 'Xenova/clip-vit-base-patch32',
    localModelPath: '/models',          // <<— deine Modelle liegen hier

    topK: 3,                            // <<— MAX. 3 TREFFER
    maxSide: 1280,                      // Downscale vor Auto-Crop (Performance)

    // ---- Auto-Crop ----
    autoCrop: true,
    edgeKeepRatio: 0.10,                // oberste 10% Kanten als Maske
    cropPadding: 0.08,                  // 8% Randzugabe um die Box
    cropMinRel: 0.40,                   // min. 40% der kleineren Bildkante

    // ---- Score-Badges ----
    showNumericScore: false,            // true = Zahlen zeigen, false = Badges
    confidenceBands: [0.90, 0.80],      // hoch ≥0.90, mittel ≥0.80, sonst niedrig

    // ---- Sonstiges ----
    debug: true
  };

  // --------- Helpers ----------
  const log=(...a)=>{ if(CFG.debug) console.log('[LabelScan]',...a); };
  const warn=(...a)=>{ if(CFG.debug) console.warn('[LabelScan]',...a); };
  const err=(...a)=>{ console.error('[LabelScan]',...a); };
  const qs=id=>document.getElementById(id);
  const setStatus=t=>{ const el=qs('ados-scan-status'); if(el) el.textContent=t||''; };
  const setProgress=p=>{
    const bar=qs('ados-scan-progress'); if(!bar) return;
    if(p==null){ bar.hidden=true; bar.value=0; }
    else{ bar.hidden=false; bar.value=Math.max(0,Math.min(1,p)); }
  };

  function resetResultsBox(msg){
    const r = qs('ados-scan-results');
    if (r) {
      r.innerHTML = `<div class="empty">${msg || 'Hier erscheinen Treffer.'}</div>`;
    }
  }

  function showPreview(file){
    const url=URL.createObjectURL(file);
    const prev=qs('ados-scan-preview');
    if(prev){
      prev.innerHTML=`<img alt="Vorschau" style="max-width:260px;width:100%;height:auto;border-radius:8px;display:block;margin:0 auto;" src="${url}">`;
      prev.setAttribute('aria-hidden','false');
    }
  }

  function base64ToFloat32(b64){
    const bin=atob(b64), len=bin.length;
    const buf=new ArrayBuffer(len), view=new Uint8Array(buf);
    for(let i=0;i<len;i++) view[i]=bin.charCodeAt(i);
    return new Float32Array(buf);
  }

  // --------- Index ----------
  let INDEX=[], INDEX_EMB=[];
  async function loadIndex({ ui=true }={}){
    if(INDEX.length) return INDEX;
    if(ui){ setStatus('Index laden …'); setProgress(0.03); }
    const rawURL = mw.util.getUrl(CFG.indexTitle,{ action:'raw', ctype:'application/json' });
    const res = await fetch(rawURL,{ cache:'reload' });
    if(!res.ok) throw new Error('Index nicht ladbar: '+res.status);
    const json = await res.json();
    if(!Array.isArray(json)) throw new Error('Index ist keine Array-JSON');
    INDEX = json;
    INDEX_EMB = INDEX.map(it => (typeof it.embed==='string' && it.embed.length) ? base64ToFloat32(it.embed) : null);
    log('Index geladen:', INDEX.length, 'Einträge');
    log('Embeddings vorhanden:', INDEX_EMB.filter(v=>v&&v.length).length, '/', INDEX.length);
    if(ui) setProgress(0.06);
    return INDEX;
  }

  // --------- Transformers (lokal) ----------
  let _visionLoadPromise=null;
  async function ensureClipVision(){
    if(_visionLoadPromise) return _visionLoadPromise;

    setStatus('Modell laden …'); setProgress(0.08);

    _visionLoadPromise = (async()=>{
      const mod = await import(/* webpackIgnore: true */ CFG.transformersURL);

      // Nur lokal laden
      mod.env.allowLocalModels = true;
      mod.env.allowRemoteModels = false;
      mod.env.localModelPath   = CFG.localModelPath;

      // WASM-Runtime (ort-wasm-simd.wasm) von transformers-CDN
      mod.env.backends = mod.env.backends || {};
      mod.env.backends.onnx = mod.env.backends.onnx || {};
      mod.env.backends.onnx.wasm = mod.env.backends.onnx.wasm || {};
      mod.env.backends.onnx.wasm.wasmPaths =
        'https://cdn.jsdelivr.net/npm/@xenova/transformers@2.15.0/dist/';

      const [processor, model] = await Promise.all([
        mod.AutoProcessor.from_pretrained(CFG.modelId),
        mod.CLIPVisionModelWithProjection.from_pretrained(CFG.modelId, { quantized: true })
      ]);

      let backend='unknown';
      try { backend = model?.session?.executionProvider || backend; } catch(_){}
      log('CLIP ready (vision, local):', model?.constructor?.name || 'unknown', '| Backend:', backend);

      return { mod, processor, model };
    })();

    return _visionLoadPromise;
  }

  // --------- Auto-Crop Heuristik ----------
  function toCanvasScaled(img, maxSide){
    const c=document.createElement('canvas');
    let { width:w, height:h } = img;
    const s = Math.min(1, maxSide / Math.max(w,h));
    w = Math.round(w*s); h = Math.round(h*s);
    c.width=w; c.height=h;
    const g=c.getContext('2d', { willReadFrequently:true });
    g.imageSmoothingEnabled = true;
    g.drawImage(img,0,0,w,h);
    return c;
  }

  function autoCropCanvas(inCanvas){
    const w=inCanvas.width, h=inCanvas.height;
    const ctx=inCanvas.getContext('2d', { willReadFrequently:true });
    const imgData=ctx.getImageData(0,0,w,h);
    const data=imgData.data;

    // Graustufen
    const gray=new Uint8ClampedArray(w*h);
    for(let y=0, p=0, i=0; y<h; y++){
      for(let x=0; x<w; x++, i++, p+=4){
        const r=data[p], g=data[p+1], b=data[p+2];
        gray[i] = (0.299*r + 0.587*g + 0.114*b)|0;
      }
    }

    // Sobel-Kanten (Magnitude)
    const mag=new Float32Array(w*h);
    const sobelX=[-1,0,1,-2,0,2,-1,0,1];
    const sobelY=[-1,-2,-1,0,0,0,1,2,1];
    for(let y=1; y<h-1; y++){
      for(let x=1; x<w-1; x++){
        let gx=0, gy=0, k=0;
        for(let j=-1;j<=1;j++){
          for(let i=-1;i<=1;i++,k++){
            const v=gray[(y+j)*w + (x+i)];
            gx += sobelX[k]*v; gy += sobelY[k]*v;
          }
        }
        mag[y*w+x] = Math.hypot(gx,gy);
      }
    }

    // Schwellwert: oberes x%-Quantil
    const vals = Array.from(mag).sort((a,b)=>a-b);
    const keep = CFG.edgeKeepRatio;
    const tIdx = Math.max(0, Math.min(vals.length-1, Math.floor(vals.length*(1-keep))));
    const thr = vals[tIdx];

    // Bounding-Box der Pixel > thr
    let minX=w, minY=h, maxX=0, maxY=0, count=0;
    for(let y=0;y<h;y++){
      for(let x=0;x<w;x++){
        const m=mag[y*w+x];
        if(m>thr){ count++; if(x<minX)minX=x; if(y<minY)minY=y; if(x>maxX)maxX=x; if(y>maxY)maxY=y; }
      }
    }

    if(count<50) return inCanvas; // zu wenig Signal → return original

    // Padding
    const pad = Math.round(CFG.cropPadding * Math.max(w,h));
    minX = Math.max(0, minX - pad);
    minY = Math.max(0, minY - pad);
    maxX = Math.min(w-1, maxX + pad);
    maxY = Math.min(h-1, maxY + pad);

    // Mindestgröße
    const boxW=maxX-minX+1, boxH=maxY-minY+1;
    const minLen = Math.round(CFG.cropMinRel * Math.min(w,h));
    let cx=minX, cy=minY, cw=boxW, ch=boxH;
    if(cw<minLen || ch<minLen){
      const needW = Math.max(minLen, cw);
      const needH = Math.max(minLen, ch);
      const centerX = Math.round((minX+maxX)/2);
      const centerY = Math.round((minY+maxY)/2);
      cx = Math.max(0, Math.min(w-needW, centerX - Math.floor(needW/2)));
      cy = Math.max(0, Math.min(h-needH, centerY - Math.floor(needH/2)));
      cw = needW; ch = needH;
    }

    const out=document.createElement('canvas');
    out.width=cw; out.height=ch;
    out.getContext('2d').drawImage(inCanvas, cx, cy, cw, ch, 0, 0, cw, ch);
    return out;
  }

  // --------- Embedding-Pipeline ---------
  async function embedFileImage(file){
    const { mod, processor, model } = await ensureClipVision();

    setStatus('Bild vorbereiten …'); setProgress(0.20);

    // 1) Bild laden
    const img = await new Promise((res,rej)=>{
      const url=URL.createObjectURL(file);
      const image=new Image();
      image.crossOrigin='anonymous';
      image.onload=()=>{ URL.revokeObjectURL(url); res(image); };
      image.onerror=e=>{ URL.revokeObjectURL(url); rej(e); };
      image.src=url;
    });

    // 2) Scale → Auto-Crop
    let canvas = toCanvasScaled(img, CFG.maxSide);
    if(CFG.autoCrop){
      setStatus('Auto-Crop …'); setProgress(0.30);
      canvas = autoCropCanvas(canvas);
    }

    // 3) Canvas → Blob → RawImage (robust für Processor)
    const blob = await new Promise(r => canvas.toBlob(r, 'image/jpeg', 0.95));
    const imageRaw = await mod.RawImage.fromBlob(blob);

    setStatus('Bild analysieren …'); setProgress(0.45);

    // 4) Processor & Model
    const inputs = await processor(imageRaw, { return_tensors: 'pt' });
    const out = await model.forward({ pixel_values: inputs.pixel_values });

    const vec = out?.image_embeds?.data || out?.image_embeds;
    if(!(vec instanceof Float32Array)) throw new Error('Embedding-Format unerwartet');

    // 5) Normieren
    let n=0; for(let i=0;i<vec.length;i++) n+=vec[i]*vec[i];
    const norm = Math.sqrt(n)||1;
    const v = new Float32Array(vec.length);
    for(let i=0;i<vec.length;i++) v[i]=vec[i]/norm;
    return v;
  }

  function cosine(a,b){ let s=0,L=Math.min(a.length,b.length); for(let i=0;i<L;i++) s+=a[i]*b[i]; return s; }

  // vorher: slice(0, topK) hier
  // jetzt: ALLE sortiert zurückgeben, damit wir danach deduplizieren können
  function rankByCosine(q){
    const s=[];
    for(let i=0;i<INDEX.length;i++){
      const v=INDEX_EMB[i];
      if(!v) continue;
      s.push({ i, score: cosine(q,v) });
    }
    s.sort((a,b)=> b.score-a.score);
    return s;
  }

  // NEU: pro Titel nur bester Treffer
  function dedupeByTitle(ranked){
    const bestByTitle = Object.create(null);
    for (let k = 0; k < ranked.length; k++) {
      const hit = ranked[k];
      const it = INDEX[hit.i];
      const rawTitle = it && it.title ? String(it.title) : '';
      const key = rawTitle.trim().toLowerCase();
      if (!key) continue;
      const prev = bestByTitle[key];
      if (!prev || hit.score > prev.score) {
        bestByTitle[key] = hit;
      }
    }
    const arr = [];
    for (const key in bestByTitle) {
      if (Object.prototype.hasOwnProperty.call(bestByTitle, key)) {
        arr.push(bestByTitle[key]);
      }
    }
    arr.sort(function(a,b){ return b.score - a.score; });
    return arr;
  }

  // --------- Score-Badges ---------
   function scoreBadge(score){
    if (CFG.showNumericScore) {
     return `<span style="font-variant-numeric:tabular-nums;color:#666">${score.toFixed(3)}</span>`;
    }
    const [hi, mid] = CFG.confidenceBands || [0.90, 0.80];
    let txt = 'niedrig', bg = '#f1f5f9', fg = '#334155';
    if (score >= hi) { txt = 'hoch';   bg = '#e6ffed'; fg = '#0a7d2c'; }
    else if (score >= mid) { txt = 'mittel'; bg = '#fff7e6'; fg = '#a45500'; }
    return `<span style="display:inline-block;padding:.12rem .45rem;border-radius:999px;background:${bg};color:${fg};font-weight:600;font-size:.85em;line-height:1">${txt}</span>`;
  }

  // --------- Rendering (max. 3 Treffer) ---------
// Score-Badge ausgeblendet
// <div>${scoreBadge(score)}</div>

  function renderResults(ranked){
    const box=qs('ados-scan-results');
    if(!box) return;
    box.innerHTML='';

    if(!ranked || !ranked.length){
      box.innerHTML='<div class="empty">Keine klaren Treffer. Bitte ein anderes Foto oder näher am Frontlabel.</div>';
      return;
    }

    // NEU: Dedupe nach Titel, DANN auf topK begrenzen
    const uniqueRanked = dedupeByTitle(ranked).slice(0, CFG.topK);

    const makeCard = (it, score) => `
      <div class="ados-card" style="display:grid;grid-template-columns:120px 1fr;gap:14px;align-items:center;padding:12px;border:1px solid #e6e6e6;border-radius:14px;box-shadow:0 1px 8px rgba(0,0,0,.04);">
        ${it.thumb?`<img src="${it.thumb}" alt="" style="width:120px;height:auto;border-radius:10px;">`
                   :`<div style="width:120px;height:90px;background:#f3f3f3;border-radius:10px;"></div>`}
        <div style="display:flex;flex-direction:column;gap:8px;">
          <div style="font-weight:700;font-size:1.05rem;line-height:1.2;">
            <a href="${mw.util.getUrl((it.title||'').replace(/ /g,'_'))}">${mw.html.escape(it.title||'')}</a>
          </div>
          <div>
            <a href="${mw.util.getUrl((it.title||'').replace(/ /g,'_'))}" class="mw-ui-button" style="display:inline-block;padding:.4rem .7rem;border-radius:8px;background:#2a4b8d;color:#fff;text-decoration:none;">Artikel öffnen</a>
          </div>
        </div>
      </div>`;

    const grid = document.createElement('div');
    grid.style.display='grid';
    grid.style.gridTemplateColumns='1fr';
    grid.style.gap='12px';

    // max. CFG.topK (=3) Karten nach Dedupe
    uniqueRanked.forEach(function(hit){
      const it = INDEX[hit.i];
      grid.innerHTML += makeCard(it, hit.score);
    });

    box.appendChild(grid);
  }

  // --------- UI / Flow ----------
  let BOUND=false;
  function bindUI(){
    if(BOUND) return;

    const btnRun = qs('ados-scan-run');
    const inCam  = qs('ados-scan-file-camera');
    const inGal  = qs('ados-scan-file-gallery');
    const btnCam = qs('ados-scan-btn-camera');
    const btnGal = qs('ados-scan-btn-gallery');
    const drop   = qs('ados-scan-drop');
    const btnReset = qs('ados-scan-reset');

    if(!btnRun || !inCam || !inGal) return;

    // Hilfsfunktion: wenn neues Bild gewählt → Vorschau & Ergebnisse zurücksetzen
    const onNewImage = (file) => {
      if (!file) return;
      showPreview(file);
      resetResultsBox('Hier erscheinen Treffer.');
      setStatus('Bereit.');
      setProgress(null);
    };

    btnCam && btnCam.addEventListener('click', ()=> inCam.click());
    btnGal && btnGal.addEventListener('click', ()=> inGal.click());

    const pick = e => {
      const f=e.target.files?.[0];
      if(f) onNewImage(f);
    };
    inCam.addEventListener('change', pick);
    inGal.addEventListener('change', pick);

    if(drop){
      drop.addEventListener('dragover', function(ev){ ev.preventDefault(); drop.classList.add('is-over'); });
      drop.addEventListener('dragleave', function(){ drop.classList.remove('is-over'); });
      drop.addEventListener('drop', function(ev){
        ev.preventDefault(); drop.classList.remove('is-over');
        const f = ev.dataTransfer && ev.dataTransfer.files && ev.dataTransfer.files[0];
        if(f){
          const dt=new DataTransfer(); dt.items.add(f);
          inGal.files=dt.files;
          onNewImage(f);
        }
      });
    }

    btnReset && btnReset.addEventListener('click', function(){
      setStatus('Bereit.'); setProgress(null);
      const p=qs('ados-scan-preview'); if(p) p.innerHTML='<div class="note">Noch keine Vorschau.</div>';
      resetResultsBox('Hier erscheinen Treffer.');
      inCam.value=''; inGal.value='';
    });

    btnRun.addEventListener('click', onRunClick);

    BOUND=true; log('UI gebunden.');
  }

  async function onRunClick(){
    const btnRun = qs('ados-scan-run');
    const inCam  = qs('ados-scan-file-camera');
    const inGal  = qs('ados-scan-file-gallery');

    try{
      const file = (inCam.files && inCam.files[0]) || (inGal.files && inGal.files[0]);
      if(!file){ alert('Bitte zuerst ein Foto auswählen.'); return; }

      if(btnRun) btnRun.disabled = true;

      // Ergebnisse direkt leeren / „Suche läuft …“
      resetResultsBox('Suche läuft …');

      await loadIndex({ ui:true });
      await ensureClipVision(); // warmup

      const q = await embedFileImage(file);

      setProgress(0.70);
      setStatus('Abgleich …');

      const ranked = rankByCosine(q);
      renderResults(ranked);

      setStatus('Fertig.');
      setProgress(null);
    } catch(e){
      err('Fehler', e);
      setStatus('Fehler bei Erkennung.');
      resetResultsBox('Fehler bei der Erkennung – bitte ein anderes Foto versuchen.');
      setProgress(null);
    } finally {
      if(btnRun) btnRun.disabled = false;
    }
  }

  function init(){
    if(document.readyState==='loading'){
      document.addEventListener('DOMContentLoaded', bindUI, { once: true });
    } else {
      bindUI();
    }
    loadIndex({ ui:false }).catch(err).finally(()=>{
      setStatus('Bereit.');
      resetResultsBox('Hier erscheinen Treffer.');
      setProgress(null);
    });
  }

  log('gadget file loaded');
  init();

})();