@Tak2님이 소개한 Groq(그록?) API을 이용해 llama3 모델을 돌려보는데 이게 그닥...

Gothrock

· 9개월 전 · 조회 861 861 · 댓글 7 7

2948608585_1738353382.6637.gif

대충 Chat-gpt에게 물어 러프한 화면구성을 하고 테스트를 해보는데 라마3엔진이 기대 이상으로 별로인데요? 제가 유료만 이용해서인 이유도 있겠지만 현격하게 수준이 떨어집니다.

P.S...테스트 페이지의 AI모델은 그록 API 무료 플랜의 'llama3-8b-8192' 엔진 이고 원활한 소통을 위해 미리 한글 사용에 대한 암시를 준 상태입니다. 까페24시 호스팅 중 극저렴 플랜이라 트래픽 제한이 있을 수 있습니다.

새벽까지 바둑을 두다 이제 들어와 테스트 페이지 만들어 테스트를 해봤고 게시판은 자고 나서나 붙여야겠네요.

연휴 참...좋았는데...

연휴무상....ㅠㅠ

댓글 작성

댓글을 작성하시려면 로그인이 필요합니다.

로그인하기

댓글 7개

Tak2

프로필 보기 이 회원 글보기

9개월 전

llama-3.3-70b-specdec 모델 또는 llama-3.3-70b-versatile이 제일 성능이 좋은 것 같습니다. llama3-8b-8192는 구버전이라 별로라고 느껴지실 수도 있어요.

제일 추천하는 것은

1. llama-3.3-70b-specdec / llama-3.3-70b-versatile

2. gemma2-9b-it

입니다. 나머지는 영..

Gothrock

프로필 보기 이 회원 글보기

9개월 전

@Tak2 그렇군요. 자고나서 바꿔 테스트를 해봐야겠습니다. 덕분에 라마를 간접체험해봅니다~!

Tak2

프로필 보기 이 회원 글보기

9개월 전

@Gothrock 싼게 비지떡인 것 같습니다. 그래도 다양한 기능을 체험해볼 수 있다는게 좋은 것 같아요. (어서 주무시길..)

수평선1203

프로필 보기 이 회원 글보기

9개월 전

딥시크 소스를 내려받았는데 까보니 라마소스를 참고했다고 주석에 나와있네요.

유튜브 영상을 보니 14빌리언모델은 pc에서 그럭저럭 돌아간다고 하네요.

[code]

# Copied from transformers.models.llama.modeling_llama.LlamaLinearScalingRotaryEmbedding with Llama->DeepseekV3
class DeepseekV3LinearScalingRotaryEmbedding(DeepseekV3RotaryEmbedding):
"""DeepseekV3RotaryEmbedding extended with linear scaling. Credits to the Reddit user /u/kaiokendev"""

def __init__(
self,
dim,
max_position_embeddings=2048,
base=10000,
device=None,
scaling_factor=1.0,
):
self.scaling_factor = scaling_factor
super().__init__(dim, max_position_embeddings, base, device)

def _set_cos_sin_cache(self, seq_len, device, dtype):
self.max_seq_len_cached = seq_len
t = torch.arange(
self.max_seq_len_cached, device=device, dtype=self.inv_freq.dtype
)
t = t / self.scaling_factor

freqs = torch.outer(t, self.inv_freq)
# Different from paper, but it uses a different permutation in order to obtain the same calculation
emb = torch.cat((freqs, freqs), dim=-1)
self.register_buffer("cos_cached", emb.cos().to(dtype), persistent=False)
self.register_buffer("sin_cached", emb.sin().to(dtype), persistent=False)

[/code]

Gothrock

프로필 보기 이 회원 글보기

9개월 전

@수평선1203 라마나 다른, 오픈llm을 이용해 입찰 견적서를 자동으로 만들게 하고 싶은데 시간이 없네요. 사실 시간이 없다기 보다는 매일 매일이 치이다 보니 정신적인 여유가 없는 듯 합니다.

들레아빠

프로필 보기 이 회원 글보기

9개월 전

사용해 보고있는데 아직은 평을 어떻게 할지 잘 모르겠습니다.

Gothrock

프로필 보기 이 회원 글보기

9개월 전

@들레아빠 확실하게 유료와는 구별이 되는데 그렇다고 그렇게 어처구니 없는 답을 주는 건 아닌듯 합니다.

게시글 목록

번호	제목	글쓴이	조회	날짜
1716888	휴일은 누구를 위해 존재하는가? 7	김하늘™	236	1개월 전
1716864	기분 급상승하게 만드는 짤 11	Gothrock	374	1개월 전
1716861	너무 도도한거 아냐? 7	해피아이	289	1개월 전
1716856	도메인 변경 요청 오면 따라야 할까요 ? 4	미니님a	305	1개월 전
1716851	간단한 AI 웹사이트 빌더. 앱도 가능 10	솔그루	577	1개월 전
1716850	게시글에 있는 유튜브를... 2	마젠토	202	1개월 전
1716848	새로운 숙소에는… 8	亞波治	233	1개월 전
1716843	감성음악 PLAYLIST	부이	86	1개월 전
1716841	봇 차단 datadome.co	엘뤼아르	131	1개월 전
1716834	둑이 무너지려고 하는데, 손이 모자라요 ㅠㅠ 4	김하늘™	197	1개월 전
1716830	@nanati 나나티님께.. 2	해피아이	189	1개월 전
1716828	Because You're Free [Synthwave \| Dream Pop Ballad]	부이	96	1개월 전
1716821	치타 김밥 5	Gothrock	177	1개월 전
1716819	그누보드3를 컨버터 만들었습니다. ^^ 1	해피정	231	1개월 전
1716815	앞으로 냑은.. 3	해피아이	199	1개월 전
1716811	드디어.. 3	해피아이	145	1개월 전
1716809	바람과 구름 2	DSKim	126	1개월 전
1716808	아직은 좀.. 1	해피아이	121	1개월 전
1716795	영카트 스킨 어떤주제로 할까요 2	비버팩토리	230	1개월 전
1716791	정말 한 6~7년 만에 오는듯 합니다. 3	바꾸나	231	1개월 전
1716784	명동에 다녀왔습니다. 4	무쏘	195	1개월 전
1716783	국세청 전자세금계산서 형식의 피싱 메일이 오네요 2	해피정	195	1개월 전
1716781	1픽셀의 감동이 소비자를 움직인다	김하늘™	163	1개월 전
1716773	애틋한..사랑.. 5	해피아이	192	1개월 전
1716765	포트폴리오.. 8	해피아이	262	1개월 전
1716761	초등학교 동창 민정이는 요즘 뭘하는지? 8	김하늘™	318	1개월 전
1716759	깝깝합니다. 정말 1	웅푸	184	1개월 전
1716743	오늘의 활동 일지..... 8	해피아이	218	1개월 전
1716734	그누보드 기반 미니홈피 개발중입니다 8	해피정	356	1개월 전
1716733	시간먹는 하마 1	뽕꽤브라	172	1개월 전

이전 다음

3 4 5 6 7

전체 목록

커뮤니티