amiga-news ENGLISH VERSION
.
Links| Forum| Kommentare| News melden
.
Chat| Umfragen| Newsticker| Archiv
.

amiga-news.de Forum > Programmierung > 68k prog wird von OS4 JIT nicht beschleunigt [ - Suche - Neue Beiträge - Registrieren - Login - ]

-1- [ - Beitrag schreiben - ]

10.02.2006, 13:21 Uhr

bernd_roesch
Posts: 364
[Benutzer gesperrt]
Weis jemand nen funktionierenden Link auf die Petunia Homepage oder die Mailadresse des Authors ?
Der Link geht nicht mehr

Ich wollte mal auf die Petunia Page dessen link hier steht um den Author zu Kontakten ob er mir sagen kann wieso einige Programme nicht beschleunigt werden.Dann könnte ich Amiblitz entsprechend änden.

Ich habe mal nem OS4 User ein testprog von nem simplen Fraktal Prog geschickt.
Das wird von dem OS4 JIT überhaupt nicht beschleunigt.

An asm code ist nix besonderes drin.Der speedkritische Teil
ist nur zwischen while und wend


optimize 7
WBStartup
DEFTYPE .f ftemp,zpt,zqt
DEFTYPE .f
XINCLUDE "eclock.include.bb2"
!screen_ {0,"test","ram:test.prefs",0}
If !screen_id=0 Then End
Window 0,0,0,!screen_width,!screen_height,$800,"",0,1

#mc=64
For i=0 To 255:
AGAPalRGB 0,i,Int((Abs(i-127)*#mc)/127),Int((Abs(i-127)*#mc)/127),#mc
Use Palette 0
Next

cp=-0.74543:cq=0.15301:xmin=-1.8:xmax=1.8:ymin=-1.2:ymax=1.2
xstep=(xmax-xmin)/!screen_width
ystep=(ymax-ymin)/!screen_height
eclock_start{1000}
RegLoad cp,ftemp,zpt,cq,zqt

For zq.f=ymin To ymax Step ystep
x=0
For zp.f=xmin To xmax Step xstep
iters.l=0
zpt=zp
zqt=zq
While Abs(zpt)<4 AND iters<255
ftemp=zpt*zpt-zqt*zqt+cp
zqt=2*(zpt*zqt)+cq
zpt=ftemp
iters+1
Wend
WPlot x,y,iters
x+1

Next
y+1
Next
RegSave
result.d=eclock_stop{}/1000
WColour 100
WLocate 10,10:NPrint "Time used ",result," sec"
MouseWait

Das ist der speedkritische asm Code.Auf der Petunia Page stand mal welche Befehle der JIT kann.Der Code enthält keinen Befehl
den der JIT nicht kann.

Bevor ein theoretiker meint der Code ist langsam...

In der Praxis verarbeitet die FPU durch register
renaming die fmove.x Befehle in 0 Zeit.daher braucht man es nicht aufwendig optimieren und FPu und integer einheit
können auch unabhängig arbeiten bei dem vergleich

115557BA): FMOVE.X FP5,FP0
115557BE): FABS.X FP0
115557C2): FMOVE.D #+4,FP1
115557CE): FCMP.X FP1,FP0
115557D2): FSLT D0
115557D6): MOVE.L -$7F3C(A5),D1
115557DA): MOVE.L #$FF,D2
115557E0): CMP.L D2,D1
115557E2): SLT D1
115557E4): EXT D1
115557E6): AND D1,D0
115557E8): TST D0
115557EA): BEQ.L speedcritical+$A2 ;1155585C
115557F0): FMOVE.X FP5,FP0
115557F4): FMOVE.X FP5,FP1
115557F8): FMUL.X FP1,FP0
115557FC): FMOVE.X FP3,FP1
11555800): FMOVE.X FP3,FP2
11555804): FMUL.X FP2,FP1
11555808): FSUB.X FP1,FP0
1155580C): FMOVE.X FP7,FP1
11555810): FADD.X FP1,FP0
11555814): FMOVE.X FP0,FP6
11555818): FMOVE.D #+2,FP0
11555824): FMOVE.X FP5,FP1
11555828): FMOVE.X FP3,FP2
1155582C): FMUL.X FP2,FP1
11555830): FMUL.X FP1,FP0
11555834): FMOVE.X FP4,FP1
11555838): FADD.X FP1,FP0
1155583C): FMOVE.X FP0,FP3
11555840): FMOVE.X FP6,FP0
11555844): FMOVE.X FP0,FP5
11555848): MOVE.L -$7F3C(A5),D0
1155584C): ADD.L #1,D0
11555852): MOVE.L D0,-$7F3C(A5)
11555856): BRA.L speedcritical ;115557BA




[ - Antworten - Zitieren - Direktlink - ]

10.02.2006, 13:25 Uhr

bubblebobble
Posts: 707
Nutzer
Hallo Bernd! Eine Premiere dich hier zu haben ?

Ich bin auch grade dem Geheimnis auf den Fersen, warum
die HD-Rec DSP Effekte beim Benchmark nicht beschleunigt werden,
aber scheinbar im normalen Betrieb schon. Vermutlich liegt es also nicht
direkt am Code, sondern an irgendwas drumherum. Ich hatte auf forbid() getippt, mal sehen ob das stimmt. Allerdings hast du das ja oben nicht drin.
--
Thilo Köhler, Author von:
HD-Rec, Samplemanager, ArTKanoid, Monkeyscript, Toadies, AsteroidsTR, TuiTED, PosTED, TKPlayer, TKUnpacker
Homepage: http://www.hd-rec.de


[ - Antworten - Zitieren - Direktlink - ]

10.02.2006, 18:18 Uhr

whose
Posts: 2156
Nutzer
@bernd_roesch:

http://amigos.amiga.hu/rachy/contact.html

Da findest Du auch die derzeit aktuelle Mailadresse von ihm.

Wäre echt cool, wenn auf dem Wege Verbesserungen in Petunia einfließen
würden. Viel Erfolg!

Grüße

--
---

:boing: µA1 PPC 750GX-800
:boing: A4000 PPC 604e-233

[ - Antworten - Zitieren - Direktlink - ]

10.02.2006, 21:52 Uhr

Goos
Posts: 69
Nutzer
denke schon, das es irgendwas mit den Forbit zu tun haben muss,
da man es schon bei Sysspeed sehen kann.
Multitaskinghaken raus CPU/FPU Mips: 37.29 MFlops 18.06
Multitaskinghaken drin Mips: 1197.85 MFlops: 498.75

Gruss Goos :smokin:

[ - Antworten - Zitieren - Direktlink - ]

11.02.2006, 12:19 Uhr

ac-logic
Posts: 91
Nutzer
@bernd_roesch:

Ein Problem könnte die Verwendung von Fvölligegal.X, da die PPC-FPU's nur 32bit und 64bit Typen verarbeiten.

[ - Antworten - Zitieren - Direktlink - ]

11.02.2006, 12:21 Uhr

AmigaPapst
Posts: 980
Nutzer
@Goos:
Mit welchem Rechner hast du das getestet?

Ich hab mit meinem AmigaOne G3-FX 800 ohne Multitaskinghaken:
MIPS: 43,04
MFOPS: 24.48

Mit Multitaskinghaken:
MIPS: 717,64
MFOPS: 329,60

Echt komisch das mein Werte ohne Multitaskinhaken besser als deine sind und meine mit Haken schlechter als deine.

Beim WarpUP PowerPC Emu Test zeigt er hier keine großartige Änderung durch den Multitaskinghaken:
MIPS: 912,53
MFOPS: 751,36

Es scheint aber die WarpUP Emu schneller zu sein als der JIT.

[ - Antworten - Zitieren - Direktlink - ]

11.02.2006, 12:33 Uhr

Goos
Posts: 69
Nutzer
@AmigaPapst:

habe ein G4 933 Mhz

ja die WarpUp Emu ist auch bei mir schneller als der Jit, allerdings hab ich nicht soviele MFLOPS wie Dein G3

MIPS: 1355
MFLOPS: 514.18

[ - Antworten - Zitieren - Direktlink - ]

11.02.2006, 13:27 Uhr

AmigaPapst
Posts: 980
Nutzer
@Goos:
Ist ja witzig. Der G3 FX scheint bei der WarpUp Emu in Floating Point besser zu sein als der G4. Ist das bei PowerPC nativen auch so? Kann das jemand bestätigen?
Naja sobald irgendwo Altivec eingebaut wird, ziehst du mich sowieso voll ab. ;)

Das sieht man gut am Dnet Rc5-72 Client:
G3 800 FX : 2,706,051.00 Schlüssel pro Sekunde
G4 800 744x/745x: 8,536,245.00 Schlüssel pro Sekunde

Das ist schon ein riesen Unterschied, obwohl der G3 FX 512 kb Cache und der G4 nur 256 kb cache hat.

[ Dieser Beitrag wurde von AmigaPapst am 12.02.2006 um 17:17 Uhr geändert. ]

[ - Antworten - Zitieren - Direktlink - ]

12.02.2006, 17:18 Uhr

AmigaPapst
Posts: 980
Nutzer
Kann sonst noch jemand Werte liefern?
--
:boing: AmigaOne XE G3 750FX 800Mhz/Sil0680/256MB + Radeon 9000 128 MB + AmigaOS 4
:dance1: A4000T CyberstormPPC 604e 200Mhz/060/128MB + CybervisionPPC 8MB + AmigaOS 3.9


[ Dieser Beitrag wurde von AmigaPapst am 12.02.2006 um 17:23 Uhr geändert. ]

[ - Antworten - Zitieren - Direktlink - ]


-1- [ - Beitrag schreiben - ]


amiga-news.de Forum > Programmierung > 68k prog wird von OS4 JIT nicht beschleunigt [ - Suche - Neue Beiträge - Registrieren - Login - ]


.
Impressum | Datenschutzerklärung | Netiquette | Werbung | Kontakt
Copyright © 1998-2024 by amiga-news.de - alle Rechte vorbehalten.
.