[ad_1]
Giới thiệu
Trong môi trường hiện nay, việc sử dụng Trò chuyệnGPT vì khoa học dữ liệu sáng kiến mang lại những lợi ích chưa từng có. ChatGPT giúp việc tích hợp dự án trở nên dễ dàng hơn nhờ tính linh hoạt trên nhiều miền, bao gồm tạo, hồi quy và phân loại ngôn ngữ cũng như hỗ trợ cho các mô hình và thư viện được đào tạo trước. Bài viết này tìm hiểu về việc xây dựng mô hình dự đoán giá cổ phiếu sử dụng ChatGPT. Chúng tôi sẽ xem xét từng bước về cách ChatGPT có thể hỗ trợ trong các giai đoạn khác nhau của dự án khoa học dữ liệu này, từ tải dữ liệu đến đánh giá mô hình.
Các bước xây dựng dự án khoa học dữ liệu bằng ChatGPT
Mặc dù Trò chuyệnGPT không thể tạo ra một khoa học dữ liệu dự án riêng của mình, nó có thể là một công cụ hỗ trợ đàm thoại hiệu quả trong suốt quá trình. Các quy trình điển hình trong việc phát triển dự án khoa học dữ liệu được chia nhỏ tại đây, cùng với cách ChatGPT có thể trợ giúp:
- Định nghĩa vấn đề: Xác định vấn đề bạn muốn giải quyết với dự án khoa học dữ liệu của mình. Hãy cụ thể về dự án của bạn và những gì bạn muốn thực hiện hoặc phân tích.
- Thu thập dữ liệu: Thu thập dữ liệu liên quan từ nhiều nguồn khác nhau, chẳng hạn như cơ sở dữ liệu hoặc bộ dữ liệu có sẵn trực tuyến.
- Tiền xử lý và thăm dò dữ liệu: Làm sạch và xử lý trước dữ liệu đã thu thập để xử lý các giá trị bị thiếu, giá trị ngoại lệ và sự không nhất quán. Khám phá dữ liệu bằng cách sử dụng số liệu thống kê mô tả, trực quan hóa và các kỹ thuật khác để hiểu rõ hơn về các đặc điểm và mối quan hệ của nó.
- Trực quan hóa dữ liệu: Trực quan hóa tập dữ liệu bằng cách sử dụng nhiều sơ đồ và biểu đồ khác nhau để hiểu rõ hơn về phân bổ, xu hướng và mẫu dữ liệu.
- Kỹ thuật tính năng: Tạo hoặc rút ra các tính năng mới từ tập dữ liệu hiện có để cải thiện hiệu suất mô hình. Xử lý các biến phân loại thông qua kỹ thuật mã hóa nếu cần thiết.
- Phát triển mô hình: Chọn cách ChatGPT sẽ được sử dụng trong dự án khoa học dữ liệu của bạn. Ví dụ: nó có thể được sử dụng để tạo văn bản, tóm tắt, phân loại hoặc phân tích dữ liệu.
- Đánh giá mô hình: Đánh giá các mô hình được đào tạo theo loại vấn đề (phân loại, hồi quy, v.v.) bằng cách sử dụng các số liệu đánh giá có liên quan như độ chính xác, độ chính xác, khả năng thu hồi và điểm F1.
Cách xây dựng mô hình dự đoán giá cổ phiếu bằng ChatGPT
Trong phần này, chúng ta sẽ xem xét một ví dụ cơ bản về xây dựng dự án khoa học dữ liệu về xây dựng mô hình dự đoán giá cổ phiếu bằng cách sử dụng Trò chuyệnGPT. Chúng tôi sẽ làm theo tất cả các bước được đề cập ở trên.
Báo cáo vấn đề
Phát triển mô hình học máy để dự đoán giá cổ phiếu trong tương lai dựa trên dữ liệu lịch sử, sử dụng đường trung bình động làm đặc điểm. Đánh giá độ chính xác của mô hình bằng cách sử dụng Lỗi bình phương trung bình và trực quan hóa giá dự đoán so với giá thực tế.
Thu thập dữ liệu
Lời nhắc
Tải tập dữ liệu và các thư viện cần thiết để dự đoán giá cổ phiếu trong tương lai dựa trên dữ liệu lịch sử. Đồng thời Xác định ký hiệu mã cổ phiếu cũng như ngày bắt đầu và ngày kết thúc để tìm nạp dữ liệu giá cổ phiếu lịch sử
Mã được tạo bởi ChatGPT
import yfinance as yf
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split, GridSearchCV
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score
ticker_symbol="AAPL"
start_date="2021-01-01"
end_date="2022-01-01"
stock_data = yf.obtain(ticker_symbol, begin=start_date, finish=end_date)
stock_data
đầu ra
Tiền xử lý và thăm dò dữ liệu
Lời nhắc
Bây giờ hãy kiểm tra các giá trị còn thiếu và khám phá cấu trúc của tập dữ liệu giá cổ phiếu được tìm nạp. Tóm tắt mọi phát hiện liên quan đến dữ liệu bị thiếu và cung cấp thông tin chi tiết về đặc điểm và cấu trúc của tập dữ liệu.
Mã được tạo bởi ChatGPT
missing_values = stock_data.isnull().sum()
print("Lacking Values:n", missing_values)
đầu ra
Trực quan hóa dữ liệu
Lời nhắc
Bây giờ hãy trực quan hóa dữ liệu giá cổ phiếu lịch sử để xác định xu hướng và mô hình. Tạo một biểu đồ thể hiện giá đóng cửa của cổ phiếu theo thời gian, cho phép hiểu rõ hơn về hiệu suất lịch sử của nó.
Mã được tạo bởi ChatGPT
print("Dataset Info:n", stock_data.information())
đầu ra
Bây giờ Trực quan hóa dữ liệu giá cổ phiếu lịch sử.
plt.determine(figsize=(10, 6))
plt.plot(stock_data('Shut'), colour="blue")
plt.title(f"{ticker_symbol} Inventory Worth (Jan 2021 - Jan 2022)")
plt.xlabel("Date")
plt.ylabel("Shut Worth")
plt.grid(True)
plt.present()
đầu ra
Kỹ thuật tính năng
Lời nhắc
Bước tiếp theo là tạo các đường trung bình động (MA) của giá đóng cửa, chẳng hạn như MA_50 và MA_200, để dùng làm đặc điểm cho mô hình dự đoán. Giải quyết các giá trị bị thiếu phát sinh từ tính toán cửa sổ cuộn để đảm bảo tính toàn vẹn của tập dữ liệu.
Mã được tạo bởi ChatGPT
stock_data('MA_50') = stock_data('Shut').rolling(window=50).imply()
stock_data('MA_200') = stock_data('Shut').rolling(window=200).imply()
print(stock_data('MA_50'))
print(stock_data('MA_200'))
đầu ra
Xóa các hàng có giá trị bị thiếu do tính toán cửa sổ cuộn.
stock_data.dropna(inplace=True)
Xác định các tính năng (đường trung bình động) và mục tiêu (giá đóng).
X = stock_data(('MA_50', 'MA_200'))
y = stock_data('Shut')
print(X.head())
print(y.head())
đầu ra
Chia dữ liệu thành các tập huấn luyện và kiểm tra.
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
print(X_train.head())
print(X_test.head())
print(y_train.head())
print(y_test.head())
đầu ra
Phát triển mô hình
Lời nhắc
Tối ưu hóa mô hình hồi quy tuyến tính thông qua điều chỉnh siêu tham số bằng GridSearchCV. Khởi tạo và huấn luyện mô hình hồi quy tuyến tính với các tham số tối ưu được xác định từ quá trình điều chỉnh siêu tham số.
parameters = {'fit_intercept': (True, False)}
regressor = LinearRegression()
grid_search = GridSearchCV(regressor, parameters)
grid_search.match(X_train, y_train)
best_params = grid_search.best_params_
print("Finest Parameters:", best_params)
đầu ra
Khởi tạo và huấn luyện mô hình hồi quy tuyến tính với các tham số tốt nhất.
mannequin = LinearRegression(**best_params)
mannequin.match(X_train, y_train)
đầu ra
Đánh giá mô hình
Lời nhắc
Sử dụng mô hình được đào tạo để đưa ra dự đoán về dữ liệu thử nghiệm. Tính toán các số liệu đánh giá bao gồm Lỗi bình phương trung bình (MSE), Lỗi tuyệt đối trung bình (MAE), Lỗi bình phương trung bình gốc (RMSE) và điểm R bình phương (R^2) để đánh giá hiệu suất mô hình. Trực quan hóa giá đóng dự đoán so với giá đóng thực tế để đánh giá thêm tính hiệu quả của mô hình.
Mã được tạo bởi ChatGPT
predictions = mannequin.predict(X_test)
# Calculate analysis metrics
mse = mean_squared_error(y_test, predictions)
mae = mean_absolute_error(y_test, predictions)
rmse = np.sqrt(mse)
r2 = r2_score(y_test, predictions)
print("Imply Squared Error:", mse)
print("Imply Absolute Error:", mae)
print("Root Imply Squared Error:", rmse)
print("R^2 Rating:", r2)
đầu ra
Hình dung giá đóng dự đoán và giá đóng thực tế.
plt.scatter(y_test, predictions, colour="blue")
plt.title("Precise vs. Predicted Shut Costs")
plt.xlabel("Precise Shut Worth")
plt.ylabel("Predicted Shut Worth")
plt.grid(True)
plt.present()
đầu ra
Phần kết luận
Bài viết này khám phá những lợi thế của ChatGPT đối với các dự án khoa học dữ liệu, nhấn mạnh cả khả năng thích ứng và tính hiệu quả của nó. Nó thu hút sự chú ý đến chức năng của nó trong việc hình thành vấn đề, đánh giá mô hình và giao tiếp. Khả năng hiểu ngôn ngữ tự nhiên của ChatGPT đã được áp dụng để thu thập, tiền xử lý và khám phá dữ liệu; điều này rất hữu ích trong việc xây dựng mô hình dự đoán giá cổ phiếu. Nó cũng đã được áp dụng để đánh giá hiệu suất, tối ưu hóa các mô hình và thu thập kiến thức sâu sắc, nhấn mạnh tiềm năng của nó trong việc thay đổi hoàn toàn cách thức thực hiện các dự án.
[ad_2]
Source link