ENGLISH VERSION |
|
Links | | | Forum | | | Kommentare | | | News melden |
Chat | | | Umfragen | | | Newsticker | | | Archiv |
amiga-news.de Forum > Programmierung > 68k prog wird von OS4 JIT nicht beschleunigt | [ - Suche - Neue Beiträge - Registrieren - Login - ] |
-1- | [ - Beitrag schreiben - ] |
10.02.2006, 13:21 Uhr bernd_roesch Posts: 364 [Benutzer gesperrt] |
Weis jemand nen funktionierenden Link auf die Petunia Homepage oder die Mailadresse des Authors ? Der Link geht nicht mehr Ich wollte mal auf die Petunia Page dessen link hier steht um den Author zu Kontakten ob er mir sagen kann wieso einige Programme nicht beschleunigt werden.Dann könnte ich Amiblitz entsprechend änden. Ich habe mal nem OS4 User ein testprog von nem simplen Fraktal Prog geschickt. Das wird von dem OS4 JIT überhaupt nicht beschleunigt. An asm code ist nix besonderes drin.Der speedkritische Teil ist nur zwischen while und wend optimize 7 WBStartup DEFTYPE .f ftemp,zpt,zqt DEFTYPE .f XINCLUDE "eclock.include.bb2" !screen_ {0,"test","ram:test.prefs",0} If !screen_id=0 Then End Window 0,0,0,!screen_width,!screen_height,$800,"",0,1 #mc=64 For i=0 To 255: AGAPalRGB 0,i,Int((Abs(i-127)*#mc)/127),Int((Abs(i-127)*#mc)/127),#mc Use Palette 0 Next cp=-0.74543:cq=0.15301:xmin=-1.8:xmax=1.8:ymin=-1.2:ymax=1.2 xstep=(xmax-xmin)/!screen_width ystep=(ymax-ymin)/!screen_height eclock_start{1000} RegLoad cp,ftemp,zpt,cq,zqt For zq.f=ymin To ymax Step ystep x=0 For zp.f=xmin To xmax Step xstep iters.l=0 zpt=zp zqt=zq While Abs(zpt)<4 AND iters<255 ftemp=zpt*zpt-zqt*zqt+cp zqt=2*(zpt*zqt)+cq zpt=ftemp iters+1 Wend WPlot x,y,iters x+1 Next y+1 Next RegSave result.d=eclock_stop{}/1000 WColour 100 WLocate 10,10:NPrint "Time used ",result," sec" MouseWait Das ist der speedkritische asm Code.Auf der Petunia Page stand mal welche Befehle der JIT kann.Der Code enthält keinen Befehl den der JIT nicht kann. Bevor ein theoretiker meint der Code ist langsam... In der Praxis verarbeitet die FPU durch register renaming die fmove.x Befehle in 0 Zeit.daher braucht man es nicht aufwendig optimieren und FPu und integer einheit können auch unabhängig arbeiten bei dem vergleich 115557BA): FMOVE.X FP5,FP0 115557BE): FABS.X FP0 115557C2): FMOVE.D #+4,FP1 115557CE): FCMP.X FP1,FP0 115557D2): FSLT D0 115557D6): MOVE.L -$7F3C(A5),D1 115557DA): MOVE.L #$FF,D2 115557E0): CMP.L D2,D1 115557E2): SLT D1 115557E4): EXT D1 115557E6): AND D1,D0 115557E8): TST D0 115557EA): BEQ.L speedcritical+$A2 ;1155585C 115557F0): FMOVE.X FP5,FP0 115557F4): FMOVE.X FP5,FP1 115557F8): FMUL.X FP1,FP0 115557FC): FMOVE.X FP3,FP1 11555800): FMOVE.X FP3,FP2 11555804): FMUL.X FP2,FP1 11555808): FSUB.X FP1,FP0 1155580C): FMOVE.X FP7,FP1 11555810): FADD.X FP1,FP0 11555814): FMOVE.X FP0,FP6 11555818): FMOVE.D #+2,FP0 11555824): FMOVE.X FP5,FP1 11555828): FMOVE.X FP3,FP2 1155582C): FMUL.X FP2,FP1 11555830): FMUL.X FP1,FP0 11555834): FMOVE.X FP4,FP1 11555838): FADD.X FP1,FP0 1155583C): FMOVE.X FP0,FP3 11555840): FMOVE.X FP6,FP0 11555844): FMOVE.X FP0,FP5 11555848): MOVE.L -$7F3C(A5),D0 1155584C): ADD.L #1,D0 11555852): MOVE.L D0,-$7F3C(A5) 11555856): BRA.L speedcritical ;115557BA [ - Antworten - Zitieren - Direktlink - ] |
10.02.2006, 13:25 Uhr bubblebobble Posts: 707 Nutzer |
Hallo Bernd! Eine Premiere dich hier zu haben ? Ich bin auch grade dem Geheimnis auf den Fersen, warum die HD-Rec DSP Effekte beim Benchmark nicht beschleunigt werden, aber scheinbar im normalen Betrieb schon. Vermutlich liegt es also nicht direkt am Code, sondern an irgendwas drumherum. Ich hatte auf forbid() getippt, mal sehen ob das stimmt. Allerdings hast du das ja oben nicht drin. -- Thilo Köhler, Author von: HD-Rec, Samplemanager, ArTKanoid, Monkeyscript, Toadies, AsteroidsTR, TuiTED, PosTED, TKPlayer, TKUnpacker Homepage: http://www.hd-rec.de [ - Antworten - Zitieren - Direktlink - ] |
10.02.2006, 18:18 Uhr whose Posts: 2156 Nutzer |
@bernd_roesch: http://amigos.amiga.hu/rachy/contact.html Da findest Du auch die derzeit aktuelle Mailadresse von ihm. Wäre echt cool, wenn auf dem Wege Verbesserungen in Petunia einfließen würden. Viel Erfolg! Grüße -- --- µA1 PPC 750GX-800 A4000 PPC 604e-233 [ - Antworten - Zitieren - Direktlink - ] |
10.02.2006, 21:52 Uhr Goos Posts: 69 Nutzer |
denke schon, das es irgendwas mit den Forbit zu tun haben muss, da man es schon bei Sysspeed sehen kann. Multitaskinghaken raus CPU/FPU Mips: 37.29 MFlops 18.06 Multitaskinghaken drin Mips: 1197.85 MFlops: 498.75 Gruss Goos [ - Antworten - Zitieren - Direktlink - ] |
11.02.2006, 12:19 Uhr ac-logic Posts: 91 Nutzer |
@bernd_roesch: Ein Problem könnte die Verwendung von Fvölligegal.X, da die PPC-FPU's nur 32bit und 64bit Typen verarbeiten. [ - Antworten - Zitieren - Direktlink - ] |
11.02.2006, 12:21 Uhr AmigaPapst Posts: 980 Nutzer |
@Goos: Mit welchem Rechner hast du das getestet? Ich hab mit meinem AmigaOne G3-FX 800 ohne Multitaskinghaken: MIPS: 43,04 MFOPS: 24.48 Mit Multitaskinghaken: MIPS: 717,64 MFOPS: 329,60 Echt komisch das mein Werte ohne Multitaskinhaken besser als deine sind und meine mit Haken schlechter als deine. Beim WarpUP PowerPC Emu Test zeigt er hier keine großartige Änderung durch den Multitaskinghaken: MIPS: 912,53 MFOPS: 751,36 Es scheint aber die WarpUP Emu schneller zu sein als der JIT. [ - Antworten - Zitieren - Direktlink - ] |
11.02.2006, 12:33 Uhr Goos Posts: 69 Nutzer |
@AmigaPapst: habe ein G4 933 Mhz ja die WarpUp Emu ist auch bei mir schneller als der Jit, allerdings hab ich nicht soviele MFLOPS wie Dein G3 MIPS: 1355 MFLOPS: 514.18 [ - Antworten - Zitieren - Direktlink - ] |
11.02.2006, 13:27 Uhr AmigaPapst Posts: 980 Nutzer |
@Goos: Ist ja witzig. Der G3 FX scheint bei der WarpUp Emu in Floating Point besser zu sein als der G4. Ist das bei PowerPC nativen auch so? Kann das jemand bestätigen? Naja sobald irgendwo Altivec eingebaut wird, ziehst du mich sowieso voll ab. Das sieht man gut am Dnet Rc5-72 Client: G3 800 FX : 2,706,051.00 Schlüssel pro Sekunde G4 800 744x/745x: 8,536,245.00 Schlüssel pro Sekunde Das ist schon ein riesen Unterschied, obwohl der G3 FX 512 kb Cache und der G4 nur 256 kb cache hat. [ Dieser Beitrag wurde von AmigaPapst am 12.02.2006 um 17:17 Uhr geändert. ] [ - Antworten - Zitieren - Direktlink - ] |
12.02.2006, 17:18 Uhr AmigaPapst Posts: 980 Nutzer |
Kann sonst noch jemand Werte liefern? -- AmigaOne XE G3 750FX 800Mhz/Sil0680/256MB + Radeon 9000 128 MB + AmigaOS 4 A4000T CyberstormPPC 604e 200Mhz/060/128MB + CybervisionPPC 8MB + AmigaOS 3.9 [ Dieser Beitrag wurde von AmigaPapst am 12.02.2006 um 17:23 Uhr geändert. ] [ - Antworten - Zitieren - Direktlink - ] |
-1- | [ - Beitrag schreiben - ] |
amiga-news.de Forum > Programmierung > 68k prog wird von OS4 JIT nicht beschleunigt | [ - Suche - Neue Beiträge - Registrieren - Login - ] |
Impressum |
Datenschutzerklärung |
Netiquette |
Werbung |
Kontakt
Copyright © 1998-2024 by amiga-news.de - alle Rechte vorbehalten. |