MediaWiki:Gadget-LabelScan.js: Unterschied zwischen den Versionen

Keine Bearbeitungszusammenfassung
Keine Bearbeitungszusammenfassung
Zeile 3: Zeile 3:
   'use strict';
   'use strict';


  // -------- Config --------
   const CFG = {
   const CFG = {
     indexTitle: (window.LabelScanConfig && window.LabelScanConfig.indexTitle) ||
     indexTitle: (window.LabelScanConfig && window.LabelScanConfig.indexTitle) ||
                 'MediaWiki:Gadget-LabelScan-index.json',
                 'MediaWiki:Gadget-LabelScan-index.json',
     topKShow: 8,           // so viele Treffer anzeigen
     topK: 8,
    topKClip: 24,          // so viele Kandidaten vor CLIP (per pHash oder einfach die ersten)
     transformersURL: 'https://cdn.jsdelivr.net/npm/@xenova/transformers@2.15.0',
    maxSide: 1024,          // Downscale lange Bildkante vorm CLIP
     transformersURL: 'https://cdn.jsdelivr.net/npm/@xenova/transformers@2.15.0/dist/transformers.min.js',
     modelId: 'Xenova/clip-vit-base-patch32',
     modelId: 'Xenova/clip-vit-base-patch32',
    maxSide: 1024,
     debug: true
     debug: true
   };
   };


   // -------- Utils --------
   function log(...a){ if(CFG.debug) console.log('[LabelScan]',...a); }
  const $ = id => document.getElementById(id);
   function warn(...a){ if(CFG.debug) console.warn('[LabelScan]',...a); }
  const log = (...a) => { if (CFG.debug) console.log('[LabelScan]', ...a); };
   function err(...a){ console.error('[LabelScan]',...a); }
   const warn = (...a) => { if (CFG.debug) console.warn('[LabelScan]', ...a); };
   const err = (...a) => console.error('[LabelScan]', ...a);


   function setStatus(t){ const el=$('ados-scan-status'); if(el) el.textContent=t||''; }
  function qs(id){ return document.getElementById(id); }
   function setStatus(t){ const el=qs('ados-scan-status'); if(el) el.textContent=t||''; }
   function setProgress(p){
   function setProgress(p){
     const bar=$('ados-scan-progress'); if(!bar) return;
     const bar=qs('ados-scan-progress'); if(!bar) return;
     if(p==null){ bar.hidden=true; bar.value=0; } else { bar.hidden=false; bar.value=Math.max(0,Math.min(1,p)); }
     if(p==null){ bar.hidden=true; bar.value=0; }
    else{ bar.hidden=false; bar.value=Math.max(0,Math.min(1,p)); }
   }
   }
   function showPreview(file){
   function showPreview(file){
     const url=URL.createObjectURL(file);
     const url=URL.createObjectURL(file);
     const prev=$('ados-scan-preview');
     const prev=qs('ados-scan-preview');
     if(prev){
     if(prev){
       prev.innerHTML='<img alt="Vorschau" style="max-width:100%;height:auto;border-radius:8px;">';
       prev.innerHTML='<img alt="Vorschau" style="max-width:100%;height:auto;border-radius:8px;" src="'+url+'">';
       prev.querySelector('img').src=url;
       prev.setAttribute('aria-hidden','false');
     }
     }
   }
   }
  function esc(s){ return mw.html.escape(String(s||'')); }


  // -------- Index laden --------
   let INDEX=[];
   let INDEX=[], INDEX_EMB=[];
  let INDEX_EMB=[];
   async function loadIndex(){
 
   async function loadIndex({ ui=true } = {}){
     if(INDEX.length) return INDEX;
     if(INDEX.length) return INDEX;
     setStatus('Index laden …'); setProgress(0.03);
     if(ui){ setStatus('Index laden …'); setProgress(0.03); }
     const raw = mw.util.getUrl(CFG.indexTitle, { action:'raw', ctype:'application/json' });
 
     const res = await fetch(raw, { cache:'reload' });
     const rawURL = mw.util.getUrl(CFG.indexTitle,{action:'raw',ctype:'application/json'});
     if(!res.ok) throw new Error('Index HTTP '+res.status);
     const res = await fetch(rawURL,{cache:'reload'});
     const data = await res.json();
     if(!res.ok) throw new Error('Index nicht ladbar: '+res.status);
     if(!Array.isArray(data)) throw new Error('Index ist kein Array');
     const json = await res.json();
     INDEX = data.filter(x => x && x.title && x.thumb);
     if(!Array.isArray(json)) throw new Error('Index ist keine Array-JSON');
     INDEX = json;
 
     INDEX_EMB = INDEX.map((it,i)=>{
     INDEX_EMB = INDEX.map((it,i)=>{
       if(typeof it.embed === 'string' && it.embed){
       if(typeof it.embed==='string' && it.embed.length){
         try { return base64ToFloat32(it.embed); } catch(e){ warn('Embed decode', i, it.title, e); }
         try{ return base64ToFloat32(it.embed); }
        catch(e){ warn('Embed-Decode',i,it.title,e); return null; }
       }
       }
       return null;
       return null;
     });
     });
     log('Index geladen:', INDEX.length, 'Einträge');
 
     setProgress(0.06);
     log('Index geladen:',INDEX.length,'Einträge');
     if(ui) setProgress(0.06);
     return INDEX;
     return INDEX;
   }
   }


   function base64ToFloat32(b64){
   function base64ToFloat32(b64){
     const bin=atob(b64), buf=new ArrayBuffer(bin.length), u8=new Uint8Array(buf);
     const bin=atob(b64), len=bin.length;
     for(let i=0;i<bin.length;i++) u8[i]=bin.charCodeAt(i);
    const buf=new ArrayBuffer(len);
    const view=new Uint8Array(buf);
     for(let i=0;i<len;i++) view[i]=bin.charCodeAt(i);
     return new Float32Array(buf);
     return new Float32Array(buf);
   }
   }


   // -------- pHash Helfer (optional) --------
   let _clipModulePromise=null;
  function hexToBigInt(h){ try { return BigInt('0x'+String(h).trim()); } catch{ return null; } }
   async function ensureClipExtractor(){
   function ham64(aHex,bHex){
     if(_clipModulePromise) return _clipModulePromise;
    const a=hexToBigInt(aHex), b=hexToBigInt(bHex);
 
     if(a===null||b===null) return 64;
     setStatus('Modell laden …');
     let x=a^b, d=0n; while(x){ d+=(x&1n); x>>=1n; } return Number(d);
    setProgress(0.08);
  }
  function phashScore(a,b){ const d=ham64(a,b); return 1-(d/64); } // 1..0


  // -------- CLIP laden --------
     _clipModulePromise = (async()=>{
  let _clipReady=null;
  async function ensureClip(){
     if(_clipReady) return _clipReady;
    setStatus('Modell laden …'); setProgress(0.08);
    _clipReady = (async ()=>{
       const mod = await import(/* webpackIgnore: true */ CFG.transformersURL);
       const mod = await import(/* webpackIgnore: true */ CFG.transformersURL);
       mod.env.localModelPath=null;
       mod.env.localModelPath=null;
       mod.env.remoteModels=true;
       mod.env.remoteModels=true;
       mod.env.allowRemoteModels=true;
       mod.env.allowRemoteModels=true;
       mod.env.useBrowserCache=true;
       mod.env.useBrowserCache=true;
       const pipe = await mod.pipeline('feature-extraction', CFG.modelId, { quantized:true });
 
       log('CLIP ready:', pipe.model?.constructor?.name||'unknown');
      // ✅ FIX: Task geändert
       const pipe = await mod.pipeline(
        'feature-extraction',
        CFG.modelId,
        { quantized:true }
      );
 
       log('CLIP ready:', pipe.model?.constructor?.name || 'unknown');
       return { mod, pipe };
       return { mod, pipe };
     })();
     })();
     return _clipReady;
 
     return _clipModulePromise;
   }
   }


   // -------- Bild → Embedding --------
   async function embedFileImage(file){
  function fileToImage(file){
     function loadImage(f){
     return new Promise((res,rej)=>{
      return new Promise((res,rej)=>{
      const url=URL.createObjectURL(file);
        const url=URL.createObjectURL(f);
      const img=new Image(); img.crossOrigin='anonymous';
        const img=new Image();
      img.onload=()=>{ URL.revokeObjectURL(url); res(img); };
        img.crossOrigin='anonymous';
      img.onerror=e=>{ URL.revokeObjectURL(url); rej(e); };
        img.onload=()=>{URL.revokeObjectURL(url);res(img);};
      img.src=url;
        img.onerror=e=>{URL.revokeObjectURL(url);rej(e);};
    });
        img.src=url;
  }
      });
  function urlToImage(url){
    }
    return new Promise((res,rej)=>{
     function scale(img,max){
      const img=new Image(); img.crossOrigin='anonymous';
      const c=document.createElement('canvas');
      img.onload=()=>res(img); img.onerror=rej; img.src=url;
      let{width:w,height:h}=img;
     });
      const s=Math.min(1,max/Math.max(w,h));
  }
      w=Math.round(w*s); h=Math.round(h*s);
  function toCanvas(img,maxSide){
      c.width=w; c.height=h;
    const c=document.createElement('canvas');
      c.getContext('2d').drawImage(img,0,0,w,h);
    let {width:w,height:h}=img;
      return c;
    const s=Math.min(1, maxSide/Math.max(w,h)); w=Math.round(w*s); h=Math.round(h*s);
     }
    c.width=w; c.height=h; c.getContext('2d').drawImage(img,0,0,w,h);
    return c;
  }
  function normalize(v){ let n=0; for(let i=0;i<v.length;i++) n+=v[i]*v[i]; n=Math.sqrt(n)||1;
     const out=new Float32Array(v.length); for(let i=0;i<v.length;i++) out[i]=v[i]/n; return out; }
  function cosine(a,b){ let s=0; const L=Math.min(a.length,b.length); for(let i=0;i<L;i++) s+=a[i]*b[i]; return s; }


  async function embedFile(file){
     const { pipe } = await ensureClipExtractor();
     const { pipe } = await ensureClip();
     setStatus('Bild vorbereiten …'); setProgress(0.20);
     setStatus('Bild vorbereiten …'); setProgress(0.20);
     const img = await fileToImage(file);
 
     const canvas = toCanvas(img, CFG.maxSide);
     const img = await loadImage(file);
     const canvas = scale(img, CFG.maxSide);
 
     setStatus('Bild analysieren …'); setProgress(0.38);
     setStatus('Bild analysieren …'); setProgress(0.38);
     const out = await pipe(canvas);
     const out = await pipe(canvas);
     const vec = out?.data instanceof Float32Array
     const raw = out && out.data;
      ? out.data
    const vec = raw instanceof Float32Array ? raw : new Float32Array(raw);
      : new Float32Array(out?.data || out || []);
     return normalize(vec);
     return normalize(vec);
   }
   }
   async function embedURL(url){
 
     const { pipe } = await ensureClip();
   function normalize(v){
     const img = await urlToImage(url);
     let n=0; for(let i=0;i<v.length;i++) n+=v[i]*v[i];
     const canvas = toCanvas(img, CFG.maxSide);
     n=Math.sqrt(n)||1;
     const out = await pipe(canvas);
     const o=new Float32Array(v.length);
    const vec = out?.data instanceof Float32Array
     for(let i=0;i<v.length;i++) o[i]=v[i]/n;
      ? out.data
     return o;
      : new Float32Array(out?.data || out || []);
     return normalize(vec);
   }
   }
  function cosine(a,b){ let s=0, L=Math.min(a.length,b.length); for(let i=0;i<L;i++) s+=a[i]*b[i]; return s; }


   // -------- Matching --------
   function rankByCosine(q){
  async function matchImage(file){
     const s=[];
    await loadIndex();
     for(let i=0;i<INDEX.length;i++){
    showPreview(file);
       const v=INDEX_EMB[i];
 
       if(!v) continue;
    // 1) Query-Embedding
       s.push({i,score:cosine(q,v)});
     const q = await embedFile(file);
 
     // 2) Kandidatenliste bestimmen
    //    a) wenn Index pHash hat und du *auch* Upload-pHash hättest → vorfiltern.
    //      (Wir haben keinen Upload-pHash → fallback: nimm die ersten N)
    //    b) Oder wenn viele ohne Embed → nimm die ersten N
    let candidates = INDEX.map((it, i) => ({ i, it, p: (it.phash ? 0.5 : 0.5) }));
    // Leichte Sortierung: solche mit Embedding bevorzugen
    candidates.sort((a,b)=>{
       const ae = INDEX_EMB[a.i] ? 1 : 0;
       const be = INDEX_EMB[b.i] ? 1 : 0;
      return be-ae;
    });
    candidates = candidates.slice(0, Math.max(CFG.topKClip, CFG.topKShow));
 
    // 3) Scoring: vorhandene Embeddings direkt; fehlende live aus Thumb
    setStatus('Kandidaten bewerten …'); setProgress(0.55);
    const scored=[];
    let done=0;
    for(const c of candidates){
       try{
        const vec = INDEX_EMB[c.i] || await embedURL(c.it.thumb);
        const s = cosine(q, vec);
        scored.push({ i:c.i, score:s });
      }catch(e){
        // Thumb-Load-Fehler ignorieren
      }finally{
        done++; setProgress(0.55 + 0.35*(done/candidates.length));
      }
     }
     }
 
     s.sort((a,b)=>b.score-a.score);
     scored.sort((a,b)=> b.score-a.score);
     return s.slice(0,CFG.topK);
     return scored.slice(0, CFG.topKShow);
   }
   }


   function renderResults(ranked){
   function renderResults(r){
     const box=$('ados-scan-results'); if(!box) return;
     const box=qs('ados-scan-results');
    if(!box) return;
     box.innerHTML='';
     box.innerHTML='';
     if(!ranked || !ranked.length){
     if(!r.length){ box.innerHTML='<div class="empty">Keine klaren Treffer.</div>'; return; }
      box.innerHTML='<div class="empty">Keine klaren Treffer. Bitte anderes Foto oder näher am Frontlabel.</div>';
     r.forEach(({i,score})=>{
      return;
       const it=INDEX[i];
    }
      const link = mw.util.getUrl((it.title||'').replace(/ /g,'_'));
     ranked.forEach(({i,score})=>{
       const thumb=it.thumb||'';
       const it=INDEX[i]; const url=mw.util.getUrl((it.title||'').replace(/ /g,'_'));
       box.innerHTML+=
       const div=document.createElement('div');
        `<div class="ados-hit" style="display:grid;grid-template-columns:60px 1fr auto;gap:10px;align-items:center;padding:.35rem 0;">
       div.className='ados-hit';
          ${thumb?`<img src="${thumb}" style="width:60px;border-radius:6px;">`:`<div></div>`}
      div.style.display='grid';
          <div><b><a href="${link}">${mw.html.escape(it.title||'')}</a></b></div>
      div.style.gridTemplateColumns='60px 1fr auto';
          <div style="color:#666">${score.toFixed(3)}</div>
      div.style.gap='10px'; div.style.alignItems='center';
        </div>`;
      div.innerHTML =
        (it.thumb? `<img src="${it.thumb}" alt="" style="width:60px;height:auto;border-radius:6px;border:1px solid #eee;">` : '<div></div>') +
        `<div><b><a href="${url}">${esc(it.title||'')}</a></b></div>` +
        `<div style="color:#666;font-variant-numeric:tabular-nums">${score.toFixed(3)}</div>`;
      box.appendChild(div);
     });
     });
   }
   }


  // -------- UI binden --------
   let BOUND=false;
   let BOUND=false;
   function bind(){
   function bindUI(){
     if(BOUND) return;
     if(BOUND) return;
     const btnCam=$('ados-scan-btn-camera');
     const btnRun=qs('ados-scan-run');
     const btnGal=$('ados-scan-btn-gallery');
     const inCam=qs('ados-scan-file-camera');
     const inCam=$('ados-scan-file-camera');
     const inGal=qs('ados-scan-file-gallery');
     const inGal=$('ados-scan-file-gallery');
     const btnReset=qs('ados-scan-reset');
     const btnRun=$('ados-scan-run');
     const btnCam=qs('ados-scan-btn-camera');
     const btnReset=$('ados-scan-reset');
     const btnGal=qs('ados-scan-btn-gallery');
     const drop=$('ados-scan-drop');
     const drop=qs('ados-scan-drop');


     if(!btnRun || !inCam || !inGal){ warn('UI unvollständig'); return; }
     if(!btnRun||!inCam||!inGal) return;


     btnCam?.addEventListener('click', ()=> inCam.click());
     btnCam && btnCam.addEventListener('click',()=>inCam.click());
     btnGal?.addEventListener('click', ()=> inGal.click());
     btnGal && btnGal.addEventListener('click',()=>inGal.click());


     const onPick=e=>{ const f=e.target.files?.[0]; if(f) showPreview(f); };
     const pick=e=>{ const f=e.target.files?.[0]; if(f) showPreview(f); };
     inCam.addEventListener('change', onPick);
     inCam.addEventListener('change',pick);
     inGal.addEventListener('change', onPick);
     inGal.addEventListener('change',pick);


     if(drop){
     if(drop){
       drop.addEventListener('dragover', e=>{ e.preventDefault(); drop.classList.add('is-over'); });
       drop.addEventListener('dragover',ev=>{ev.preventDefault();drop.classList.add('is-over');});
       drop.addEventListener('dragleave', ()=> drop.classList.remove('is-over'));
       drop.addEventListener('dragleave',()=>drop.classList.remove('is-over'));
       drop.addEventListener('drop', e=>{
       drop.addEventListener('drop',ev=>{
         e.preventDefault(); drop.classList.remove('is-over');
         ev.preventDefault();drop.classList.remove('is-over');
         const f=e.dataTransfer?.files?.[0];
         const f=ev.dataTransfer?.files?.[0];
         if(f){ const dt=new DataTransfer(); dt.items.add(f); inGal.files=dt.files; showPreview(f); }
         if(f){ const dt=new DataTransfer(); dt.items.add(f); inGal.files=dt.files; showPreview(f); }
       });
       });
     }
     }


     btnReset?.addEventListener('click', ()=>{
     btnReset && btnReset.addEventListener('click',()=>{
      setStatus('Bereit.'); setProgress(null);
      qs('ados-scan-preview').innerHTML='<div class="note">Noch keine Vorschau.</div>';
      qs('ados-scan-results').innerHTML='<div class="empty">Hier erscheinen Treffer.</div>';
       inCam.value=''; inGal.value='';
       inCam.value=''; inGal.value='';
      const p=$('ados-scan-preview'); if(p) p.innerHTML='<div class="note">Noch keine Vorschau. Wähle ein Foto.</div>';
      const r=$('ados-scan-results'); if(r) r.innerHTML='<div class="empty">Hier erscheinen passende Abfüllungen mit Link ins Wiki.</div>';
      setStatus('Bereit.'); setProgress(null);
     });
     });


     btnRun.addEventListener('click', async ()=>{
     btnRun.addEventListener('click',onRunClick);
      try{
        const f=inCam.files?.[0] || inGal.files?.[0];
        if(!f){ alert('Bitte zuerst ein Foto aufnehmen oder auswählen.'); return; }
        btnRun.disabled=true; setStatus('Starte …'); setProgress(0.02);
        await loadIndex();
        const ranked = await matchImage(f);
        renderResults(ranked);
        setStatus('Fertig.'); setProgress(null);
      }catch(e){ err(e); setStatus('Fehler bei Erkennung/Suche.'); setProgress(null); }
      finally{ btnRun.disabled=false; }
    });


     BOUND=true;
     BOUND=true;
Zeile 259: Zeile 213:
   }
   }


   // -------- Init --------
   async function onRunClick(){
    try{
      const inCam=qs('ados-scan-file-camera');
      const inGal=qs('ados-scan-file-gallery');
      const btnRun=qs('ados-scan-run');
 
      const file=inCam.files?.[0]||inGal.files?.[0];
      if(!file){ alert('Bitte zuerst ein Foto auswählen.'); return; }
 
      btnRun.disabled=true;
      await loadIndex({ ui:true });
 
      if(!INDEX_EMB.some(v=>v&&v.length)){
        setStatus('Index enthält keine Embeddings.');
        setProgress(null);
        return;
      }
 
      const q=await embedFileImage(file);
      setProgress(0.70);
      setStatus('Abgleich …');
 
      renderResults(rankByCosine(q));
      setStatus('Fertig.');
      setProgress(null);
    }catch(e){
      err('Fehler',e);
      setStatus('Fehler bei Erkennung.');
      setProgress(null);
    }finally{
      const btnRun=qs('ados-scan-run');
      if(btnRun) btnRun.disabled=false;
    }
  }
 
   function init(){
   function init(){
    log('gadget file loaded');
     if(document.readyState==='loading'){
     if(document.readyState==='loading'){ document.addEventListener('DOMContentLoaded', bind, {once:true}); }
      document.addEventListener('DOMContentLoaded',bindUI,{once:true});
     else { bind(); }
     } else bindUI();
    setTimeout(bind,250); setTimeout(bind,1000);
 
     // Index vorwärmen
     // Warm load ohne UI
     loadIndex().catch(err);
     loadIndex({ ui:false }).catch(err).finally(()=>{
      setStatus('Bereit.');
      setProgress(null);
    });
   }
   }
  log('gadget file loaded');
   init();
   init();
})();
})();